Gene Aasi_0402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aasi_0402
Symbol
ID	6377341
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Amoebophilus asiaticus 5a2
Kingdom	Bacteria
Replicon accession	NC_010830
Strand	+
Start bp	473271
End bp	474290
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	37%
IMG OID	642681568
Product	hypothetical protein
Protein accession	YP_001957549
Protein GI	189501832
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTACAT CCCGAACAGA ACTTAAAGAT TTAGGTAAAT TTAAACTTAT TGAAACTATT 
ACAGAAAACT TTAAACTTCA TCATCCAACT TCCATTCATG GAATTGGAGA TGATGCTGCT 
GTAATTGATA CAGGTAATTT TTATATCCTG GTTACTACAA ATATGTTGGT GGAAGGGGTA 
GCCTTTGATC TTACTTATTG CCCCCTTAAG CATGTAGGCT ATAAAGCTGT TGTTGGTACC 
ATGGCTGATA TTATAGCTAT GAATGGTACT CTTGAACAGA TAACGGTCAG TATTGCTATC 
AGTAATCGAT TTACCCTAGA AGCTGTGCAG GAGCTTTATC AAGGTATTTA TAGAGCTTGC 
GAGCATTACA AAGTAGATCT AGTAGGCGGT GATACAACTT CTTCTACTTC TGGATTAATT 
CTTTCTATTA CTGCTATAGG AAAGGTAGTC AAAGAAAAGT TATGTTTAAG AAAAGGTGCT 
AAGCCTTATG ATTTGGTTTG CGTAACAGGT GACCTGGGGG CAGCTTATTT GGGACTGCAA 
ATATTAAACA GAGAAAAAAA GATATTTGAG GTAGATCCTC ATATGCAGCC AAAGCTAGAA 
CCTTATCAAC ATCTTATAGA AAGGCAGCTA AAACCAGAGG CGCGTACCGA AATAATACAG 
CTATTTGACC AAGAAAATAT ACTTCCCTCT AGTATGATTG ATATTTCAGG TGGATTAGCT 
TCTGGGCTAT TGCATATCAA CAAAGTTTCT GGCGTAGGGA TTACTATTTA TGAGAATAAA 
TTACCTATTA ACCAGAAAAC TTATGAGACT GCTGAGGCGC TTCATCTTTC ATCCACGTTA 
TGTGCATTGC ATGGCGGCGA AGATTATGAA TTGTTGTTTA CTATCCCACA AAGCGAGCTT 
CCTAAAATAG AAAAACACCC TAACATACAT GTAATAGGTT ATGTTACTGA CGTAAGTCTA 
GGTGTAAAAT TAATAACCAA CAGTGATGAA TCAATAGAGA TAAACGCCCA AGGTTGGTGA

Protein sequence

MSTSRTELKD LGKFKLIETI TENFKLHHPT SIHGIGDDAA VIDTGNFYIL VTTNMLVEGV 
AFDLTYCPLK HVGYKAVVGT MADIIAMNGT LEQITVSIAI SNRFTLEAVQ ELYQGIYRAC 
EHYKVDLVGG DTTSSTSGLI LSITAIGKVV KEKLCLRKGA KPYDLVCVTG DLGAAYLGLQ 
ILNREKKIFE VDPHMQPKLE PYQHLIERQL KPEARTEIIQ LFDQENILPS SMIDISGGLA 
SGLLHINKVS GVGITIYENK LPINQKTYET AEALHLSSTL CALHGGEDYE LLFTIPQSEL 
PKIEKHPNIH VIGYVTDVSL GVKLITNSDE SIEINAQGW