Gene Athe_2167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2167
Symbol
ID	7408360
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2295739
End bp	2297277
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	32%
IMG OID	643716532
Product	flagellar hook-length control protein
Protein accession	YP_002574015
Protein GI	222530133
COG category	[N] Cell motility
COG ID	[COG3144] Flagellar hook-length control protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGCACAC AGAACATTGT TAACACTAAT ATGCTGTTTT TAAAAACATT CTCTGCGACA 
TCAAAGACAA AAGATAGGCA GGAAAACAGT ATATCATTTA AAGATGTTTT CAAAAAGGCA 
TCTGACATTG CAAAAGATAC AGACAATAAA AGTAATAGTT TACAAAAAAA TGCAGAAGAA 
AGCTACAGAG CAGCTATTGT AACTTCTAAA AGACAATTTC AAAATGAGAA CCAAAACTTG 
CACGTAGATA CACCTTTTTC TAAAGAATTG CCAGACGGTA CAAACTCAGA CTTAGAAAAC 
AGGGCTGAAA TTCAATCATT GCAAGCTCAG GTGATGGAAT TTTTACAGCT AATTTTTAAT 
TTGATACAAA GCGGTGAAAG CTTGGACAAG TTTAATTTAG ACAAGCTTTT TCAGAATAGT 
AGCATCCAAG AGACAAACTT TTTAAATTCG CAGCTGCAAT CACTAAAGAT GGATGTGGAT 
TTAGATCAAT ATTTAAATTT AAACATTAAT CAAAGCAATA AAACAACAAT TACGAAAATT 
TTACACAATA TATTGCAAAA AATGGTTAAA GATACTCAAA ATCAGCAAGT TCAAAATTTT 
ATCTATGTGC AAGGAAGTGA AGTTAATCGA GAAAATATTT TTGAGTTGTT AAAAGAGGTC 
TTGCTTGAAA AAGAAGGGGA AAAACAGATA TTTGATGTTA AATCGGATGA TAGTTCATGG 
GTTAAAAGTT TTATAAATCT TTTTGCACAG GAAGGTCAAA GCTTCAAAGT TTTGTCTGAA 
GCAAGTGGTG GAAAAGAGAT TTTAAAGAAT GTTTTAAATG AGCTTGAGAA TATTGCTAAA 
AGATTAAATG TGCAAAAAAT AGTAGATAGT TTTAATATGG AGAGTCCAGA GAGAGTACAA 
ATAGCCGAAA AAGGGAACAG CAATTTTAAT GGTATAGGTT CAAATGATGG TGATTTTAAC 
AAAGTTTTTT CAACCTTGTT GAAAAAAGAT GAAGGCAGTA GCATAAATGA CCAAAAAGGA 
GAAGTTAAAA CCTTAGATTT GAGACAGCAT GTTTTTGCTT TTCAGAACAA GGTAGAGAAT 
ATAGAGAACA CAACACCTTC CCAAAATGAC AGAATAATAA AAGATCTCAG AATGTCTATA 
ATTAATCAGC TTGCAGAAAA AATTTCTGTA GTCAGTAGAC AGAATTTGAC TACATTGCAG 
GTGAGCATAA AACCTGAGTG GCTTGGAAGT GTTGTGATTG AACTGAGCAA AGATAGTAGC 
GGAAAGATTT TTGGGAATCT CATTGTAACA ACGCCGCATG TTAAAGAAAT CATAGAAGGG 
TCACTGAATA CTCTTCTTAC TATACTCAAA GACCAGGGAA TAAATATATC ACAACTTAAT 
GTAAGCTTGG GAGGAAATTT TACTGGTCAG CAGAATCAAG AACAGCAGAG GTTTTCTCAA 
AGAAAAAATT TGATTGTTCA AGGTAATGAG GAGAGTATCA GAAGTATAGA GAGTTTGATT 
TATGAGATAA ATGAAAGTAT TCTTAACTTG AAAGCTTGA

Protein sequence

MGTQNIVNTN MLFLKTFSAT SKTKDRQENS ISFKDVFKKA SDIAKDTDNK SNSLQKNAEE 
SYRAAIVTSK RQFQNENQNL HVDTPFSKEL PDGTNSDLEN RAEIQSLQAQ VMEFLQLIFN 
LIQSGESLDK FNLDKLFQNS SIQETNFLNS QLQSLKMDVD LDQYLNLNIN QSNKTTITKI 
LHNILQKMVK DTQNQQVQNF IYVQGSEVNR ENIFELLKEV LLEKEGEKQI FDVKSDDSSW 
VKSFINLFAQ EGQSFKVLSE ASGGKEILKN VLNELENIAK RLNVQKIVDS FNMESPERVQ 
IAEKGNSNFN GIGSNDGDFN KVFSTLLKKD EGSSINDQKG EVKTLDLRQH VFAFQNKVEN 
IENTTPSQND RIIKDLRMSI INQLAEKISV VSRQNLTTLQ VSIKPEWLGS VVIELSKDSS 
GKIFGNLIVT TPHVKEIIEG SLNTLLTILK DQGINISQLN VSLGGNFTGQ QNQEQQRFSQ 
RKNLIVQGNE ESIRSIESLI YEINESILNL KA