Gene Athe_1336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1336
Symbol
ID	7408917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1422403
End bp	1423644
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	33%
IMG OID	643715701
Product	stage IV sporulation protein B
Protein accession	YP_002573209
Protein GI	222529327
COG category
COG ID
TIGRFAM ID	[TIGR02860] stage IV sporulation protein B

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAAAAAC TGGCGGGTGG ACTTTTTCTT TTCTATATTC TAATTACCAC CTTTTTAGTC 
ATCTATCTTT ACATTACTCC TGATTGTCTT ACTTGTTACA GCTCAGACAA AGCTATTACT 
ATTAAAACTC CTATTTTTGT TAATGTTAAT CTAAGTCCTT CAAATGTTCA AACCAGAACA 
CAAATAAAAT TTCTTTACAG AACAAATAAG ATTTATATTC CAAAGAAGCA TTCTTCAGTT 
TTATGCGAGC TAAAAATTGG TACAATACCG CTCAAAAAGG TAAGAATCTC TATTCTTGAA 
TCAAACAAGG TCTGGGTTTC TGGGAAATTT ATAGGAATCA AGCTTATGAC AGATGGAATA 
CTTGTTATAG GATATTCTTA CGTAAGTAAT GGTAGTAATT CAACTTCACG AGTTCCTGCA 
AAAGAAGCAG GTATCCAAAT AGGTGATAAG ATTGTATATG TAAATGGGCT GAAGGTAAAA 
GACTGCAATC AGCTTTTTAA AATCATAAAC TCATCAGGTG GCAAGTCCTT AGTTTTTGTA 
ATCAAAAGAG GACAAACCTA TAAACAGTTC AAAGTAAAAC CACTTCTAAG TAACGAAGGT 
GTATACAAAA TAGGACTGTG GGTCAGGGAT GGTACAAGTG GCATTGGAAC AGTTACATTT 
GTAGATACCA AAAGAAAGGT TTTTGGTGCT CTTGGCCATG GTATATCAGA CATAGACACA 
GGTATTCTTC TGGATGTGAA AGAGGGACAA ATTTATTCAG CCGAAATAGT TGATATAAGA 
AAAAACGATA AAAGTGAGAT TGGCGAAGTT GTTGGCAAAA TCAATGAAAA CTGTGTAGTT 
GGCGATGTGA TTATTAATAC TCCATACGGG ATTTATGGTA AAATAATTCA AAATGGTTTT 
TGGGATAGCC TTCAAAGTAT CGAGATTGCC CGACTTCAGG ATATTCACGT AGGTAGTGCA 
TATATTTTAA GTGAAGTTTC AGGGAATATT GAAAAGTTTG AAATAAAAAT AGAAAGAATT 
TTGCCTCTTT ATAGAAATTC GACAAAAGCA TTTGTTATAA GGATTACTGA TAAAAGACTT 
CTTCAGCTCA CATCTGGAAT TGTTCAAGGA ATGAGTGGCT CTCCAATTAT TCAGGATAAT 
AAACTTGTCG GAGCTATTAC TCATGTTTTT TTGCAAGAAC CAGAAAGAGG ATACGGTGTT 
TTTATTGATA ATATGCTAAA TATCACAAAA TATATCAAAT AA

Protein sequence

MKKLAGGLFL FYILITTFLV IYLYITPDCL TCYSSDKAIT IKTPIFVNVN LSPSNVQTRT 
QIKFLYRTNK IYIPKKHSSV LCELKIGTIP LKKVRISILE SNKVWVSGKF IGIKLMTDGI 
LVIGYSYVSN GSNSTSRVPA KEAGIQIGDK IVYVNGLKVK DCNQLFKIIN SSGGKSLVFV 
IKRGQTYKQF KVKPLLSNEG VYKIGLWVRD GTSGIGTVTF VDTKRKVFGA LGHGISDIDT 
GILLDVKEGQ IYSAEIVDIR KNDKSEIGEV VGKINENCVV GDVIINTPYG IYGKIIQNGF 
WDSLQSIEIA RLQDIHVGSA YILSEVSGNI EKFEIKIERI LPLYRNSTKA FVIRITDKRL 
LQLTSGIVQG MSGSPIIQDN KLVGAITHVF LQEPERGYGV FIDNMLNITK YIK