Gene Aasi_1074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_1074
Symbol
ID	6377405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	1386461
End bp	1387957
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	38%
IMG OID	642682187
Product	hypothetical protein
Protein accession	YP_001958148
Protein GI	189502431
COG category	[R] General function prediction only
COG ID	[COG3497] Phage tail sheath protein FI
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGAAA ATTTAAAAAC TCCCGGCGTA TATATCGTCG AGAAGGACAC CGGTGCCAAT 
GCTGTGGTTC AGGTGGCAAC TGCAGTTCCC GTTTTCATAG GATTTACCGA GCGGGCAGAA 
ATCAATGGAA AATCTTTCCA TATGAAGCCG GTGCATATTA ACTCTTTATC TGAGTTTGAA 
ATATTCTATG GAAAAGCACC TGTGCCTGTC TTTACCGTTA AACCTGCAGA AAAAGGAGGT 
GGAGATCTTA ATATGAATGG ACAAATGTAT ACCTTACAAC AAAGTCCTTA TTCAAAATTT 
TACCTATACA ATAGTTTAAA ATTATTTTTT GATAATGGTG GTGCAGATTG CTACATCATA 
TCTATTGGAC AATATGGTAA AGATCCACAA CTGCTAGCAA TTACCCCTGA TACATTCAAA 
AAAGCAATAG ATACCTTAGC AGGCGAAGAA GTACCTACTA TGTTGCTTAT GCCCGACTCT 
CTGCTACTAG ATGAAGAAGA TTCTTCTTAT TATTCTGTAC AAACATATGC TTTGCAACAT 
TGTGGCAAAT ATATGGATAA AGTAGCGCTA TTTGATATCT GGGGAAGTGG AGAAGAGCTT 
CCATTAGGAG AAGACAAAAA TAAATATGTA ACTCGATTTA GAGAAAATAT AGGCTTAGAC 
AACCTAACCT ATGGTGCAGC GTACTACCCT TGGGTTAAAA CCAATATCAT ATCAATCAAC 
GATATTGGAT ATGAGAACTT TAATTTAGAT TCTTTAGAAT CTCTTATTAA TGAAGCACAC 
AAACCTATCC TGCACAATAT CAAAACTGCT ACTAGCGAAA AGGAGAAAAA ATATTGGGAT 
GCAGGACTTA AAAATGCTAG TAAAGAATAT AAGCTTCTAC GTAAAACTAT AGCAGACAGA 
CTTAATGTAT TGCCAGCAGC ACCAGCTATG GCAGGGTTGT ACACACGTAC TGATAGAAGT 
AGAGGCGTAT GGATAGCACC AGCTAACCAA AACCTAAATT CTGTTATTGA GCCTGCTATT 
AAGATTACGC ATGAAGATCA AGAAACTCTT AACGTAGATG CTATAAGCGG AAAATCTATT 
AATGCTATCC GTGCATTTAG AGGAAGAGGA TCTGCTATTG TTTGGGGGGC AAGAACGTTG 
GCAGGCAACA ATGTAGAATG GCGCTATATT AACGTAAGGA GATTATTTAT ACTTATTGAA 
CAGTCTATCA AACAAGCATC CTTCTCTGTT GTATTCCAAC CTAACGTATC CATAACCTGG 
GCTATAGTAA AAGGAAGTAT TGGTAACTTC TTAACCAACT TGTGGAGACA AGGTGCTTTA 
GTAGGAAACA CTCCTTCTGA AGCCTTTACA GTAAGCTGTG GACTTGGTGA AACTATGACT 
CAAGAAGACA TTAATGAAGG TATCATGCGA ATAAAAGTTC AGGCAGCAGC TTCTAGACCA 
GCAGAGTTTA TCGTCATTAC ATTTGAGCAA AAGATGGGCG GACAAGAAGG AAGTTAA

Protein sequence

MPENLKTPGV YIVEKDTGAN AVVQVATAVP VFIGFTERAE INGKSFHMKP VHINSLSEFE 
IFYGKAPVPV FTVKPAEKGG GDLNMNGQMY TLQQSPYSKF YLYNSLKLFF DNGGADCYII 
SIGQYGKDPQ LLAITPDTFK KAIDTLAGEE VPTMLLMPDS LLLDEEDSSY YSVQTYALQH 
CGKYMDKVAL FDIWGSGEEL PLGEDKNKYV TRFRENIGLD NLTYGAAYYP WVKTNIISIN 
DIGYENFNLD SLESLINEAH KPILHNIKTA TSEKEKKYWD AGLKNASKEY KLLRKTIADR 
LNVLPAAPAM AGLYTRTDRS RGVWIAPANQ NLNSVIEPAI KITHEDQETL NVDAISGKSI 
NAIRAFRGRG SAIVWGARTL AGNNVEWRYI NVRRLFILIE QSIKQASFSV VFQPNVSITW 
AIVKGSIGNF LTNLWRQGAL VGNTPSEAFT VSCGLGETMT QEDINEGIMR IKVQAAASRP 
AEFIVITFEQ KMGGQEGS