Gene Aasi_0298 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_0298
Symbol
ID	6377735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	-
Start bp	344014
End bp	345192
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	34%
IMG OID	642681479
Product	hypothetical protein
Protein accession	YP_001957464
Protein GI	189501747
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.343578
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATGG ATGGTACAGA AATTTATACA AAAGAAACTA AACCTAACAT TAAATCAATA 
ACCTTAAGGT ATCTAAAATT ACTATTTAGA TGGGTCAATA AATACAAATG GTTGTTATTA 
CTACTGTTAC TATTTTTGTT TATTATTTCA GTTAGAAAGG AAAAGCCACA AGTTATAACC 
TTACAAGGGC AAGCATTAGG GAGAAATTAT ACTGTACAAT ATAAAGTAAA AGGAGATGCT 
AACTACCAAA CTGAGATTGA AGCTTTGTTA GCTGATGTAT CACAAGCGTT AGATATTTCC 
AACAAAGATT CAGAGGTAGC TAAGTTTAAT AGACATAACT GTACAGCATT TCATTTTGAG 
TCTCCTTATT TATATCCTAT CCTTGATAAA AGCAAAGAAA TATATAATAG AACACAAGGA 
GCTTTTGACC CTACGGTAGC CCCTCTTATT AAACTGTGGA AAAACAACCT ACAGAAAGGT 
ATACCTCCTG CTAATTCACA AATACAAGCT TTACAAGAAT ATGTTGGTTT AGACTATGTA 
GTAGTGAATC AGAAGCGAGT AAAAAAACTG AAAGAAGGAG TTACAGTTGA TTTAAGCAGT 
ATCATTTCTA GTTATGCGAT AGACGTGATA GTAGCTTTTT TACATTCTAA AGGTGTAAAA 
GATTTGTGTA TAGAATTAGG TAATGAAGCG GTAGCACATG GGATAAATAG TGACAAACAG 
CCGTGGCAAG TAAAACGAAC CATAACTGAA AATAAGTTTA TAATTGAACC TTTTTCTATA 
CACGGCAAGC TAACTGACAA AGCTATTTCT ATAGTTAGGC AGTATGCTCC TTGGGACAGT 
GAACAAAACA TGCATATTAT TATTAACCCA CAAACAGGCT ATCCCGCTCA TGGAAATATA 
ATAGCTGCTT CCGTACTAGC AAATGACTGT ACGACAGCAA GCGCATATGC CACGGCTATT 
CTTACAAAAG ATTTTGATGG AGCTTTAAAA ATGCTTGAAA CCATCGATAG CATAGAAGTG 
TTTCTGATAT ACCAAGACGA GCAGGGTAAA GTGGAGTTTT ACAATTCTAA GGGACTACAC 
ATACAACCTA AGGAAGGCGT TCAAGGAATT TATCTTGAAA ATAAAAAAGC AGTAGCAGAA 
GATTCTTCTA AGGAATCAAA AGTACAGGCT GATAATTAA

Protein sequence

MKMDGTEIYT KETKPNIKSI TLRYLKLLFR WVNKYKWLLL LLLLFLFIIS VRKEKPQVIT 
LQGQALGRNY TVQYKVKGDA NYQTEIEALL ADVSQALDIS NKDSEVAKFN RHNCTAFHFE 
SPYLYPILDK SKEIYNRTQG AFDPTVAPLI KLWKNNLQKG IPPANSQIQA LQEYVGLDYV 
VVNQKRVKKL KEGVTVDLSS IISSYAIDVI VAFLHSKGVK DLCIELGNEA VAHGINSDKQ 
PWQVKRTITE NKFIIEPFSI HGKLTDKAIS IVRQYAPWDS EQNMHIIINP QTGYPAHGNI 
IAASVLANDC TTASAYATAI LTKDFDGALK MLETIDSIEV FLIYQDEQGK VEFYNSKGLH 
IQPKEGVQGI YLENKKAVAE DSSKESKVQA DN