Gene Athe_1310 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1310
Symbol
ID	7408891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1399394
End bp	1400509
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	34%
IMG OID	643715675
Product	Thiamin pyrophosphokinase catalytic region
Protein accession	YP_002573183
Protein GI	222529301
COG category	[S] Function unknown
COG ID	[COG4825] Uncharacterized membrane-anchored protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAAAAG GGAAGGTTAG AGTTGATAGA AGAACTAAAA ACTTGGTAAG AAGACTAAGA 
CCAGGTGAAA TACCTGTTAT AATGCACGAG GATATTGATG AGGTAGCTGC ATATTCTCTT 
TTGGAGAAAA AAGTGAGGGT TGTAATCAAT TGTGCTAAAT CTTTTACAGG GAAATTTCCA 
GCAGTTGGTG CAAAGATTCT TCTTGCACAT GATGTGATCA TAATTGATAA TTTAGGGGAA 
GATGTATTTA ATCGAATAAG AGAAGGGGAC GTTGTAGAAA TCGAAGATGA TAAGATATTT 
TTAAATGGTA ATTATCTATG CATTGCAAAA TATCTTACTA AAGAAGAATT TGAATCATTT 
TATCAAAAGA GTTTCAAAGA AATGGAAAAT CTTTTGGAAG ATTTTATAGA AAATACATTG 
GAGTATGCAA AAAAAGAAAA AGGATTTATC TTAGGACAAT TTGAAATGCC TGATATTTCA 
ACTAAAATTG CTGGCAGACA TGTACTTGTT GTGACAAGAG GAAGCAGTTT TAAAAAAGAT 
ATAAAAGCAA TAAAAGGTTA TATTACAGAG GTAAAACCAG TTGTGATTGC AGTTGATGGC 
GCTGCTGATG CATTGCTTGA GGAAAAGATA AGACCAAACA TTATAATTGG GGATATGGAT 
AGTGTATCTG AAGAAAGTCT TTACAAATGT GACGAGATAA TTGTTCATTC ATATCCAAAT 
GGATATGCAC CAGGGCTAAG AAAAATACAG GCTTTAGGAC TTAAGGCAAA AACAATAGCA 
TGCCCTGGTA CGAGTGAAGA TGTTGCTTTG CTTTTGGCTT ATGAAAAGGG GGCAGAACTT 
ATAGTTTCGG TTGGTTCTCA CAGCAGTATG CTTGATTTTT TAGAGAAAGG TCGAAAAGGA 
ATGTCAAGCA CTTTTCTGGT CAGGCTAAAA ATAGGTTCAA AGCTTGTGGA TGCAAGAGGT 
GTATCCAAGC TTTATACTGA AAAGGTAAGT TTCAAGTATA TTGGGGTTTT GTTGTTTTCT 
GCACTTATTC CTATACTTGC AATCCTGATG GTAACTCCGC CTTTTCAATA CTTTTTCTAT 
TTAATTCAAC TAAAACTGAG AGTAATCTTG AGGTAG

Protein sequence

MIKGKVRVDR RTKNLVRRLR PGEIPVIMHE DIDEVAAYSL LEKKVRVVIN CAKSFTGKFP 
AVGAKILLAH DVIIIDNLGE DVFNRIREGD VVEIEDDKIF LNGNYLCIAK YLTKEEFESF 
YQKSFKEMEN LLEDFIENTL EYAKKEKGFI LGQFEMPDIS TKIAGRHVLV VTRGSSFKKD 
IKAIKGYITE VKPVVIAVDG AADALLEEKI RPNIIIGDMD SVSEESLYKC DEIIVHSYPN 
GYAPGLRKIQ ALGLKAKTIA CPGTSEDVAL LLAYEKGAEL IVSVGSHSSM LDFLEKGRKG 
MSSTFLVRLK IGSKLVDARG VSKLYTEKVS FKYIGVLLFS ALIPILAILM VTPPFQYFFY 
LIQLKLRVIL R