Gene Athe_2164 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2164
Symbol
ID	7408357
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2293272
End bp	2294738
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	40%
IMG OID	643716529
Product	protein of unknown function DUF1078 domain protein
Protein accession	YP_002574012
Protein GI	222530130
COG category	[N] Cell motility
COG ID	[COG1749] Flagellar hook protein FlgE
TIGRFAM ID	[TIGR01396] flagellar basal-body rod protein FlgB [TIGR03506] fagellar hook-basal body proteins

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAGGT CAATGTTTTC ATCTATCTCT GCTCTCCGCG CTCACCAGAC AAGAATGGAC 
GTTATTGGTG ATAACATCGC CAATGTAAAT ACAGTGGGGT TTAAGTCAAG CAGAGTGACA 
TTTGCCTCTG TATTTGCTTC TGTTTTAAAG TCAGCGTCAG CACCAGATAC AGCGTCAGGT 
CGAGGCGGGT CAAACCCTAT GCAGATTGGT CTTGGTGTGT CGGTTGCCTC TGTTGATATG 
AACATGACAA GAGGAAGCCT TCAGAGAACA GATAATCCAA CAGACCTTGC AATTGAAGGT 
GATGGATTTT TTGTTGTGGG AGGGGACGGA AAAGCTCCGC GATTCACCAG AGCGGGGAAT 
TTCAGTTTAG ACAAGATGGG GAATTTAGTG ACCGCAACAG GATTAAATGT TCTGGGATGG 
ATGTATGATC CTGTAAACAA TCAAATTGAT ACAACAAAAT CGCCTTCAAA GATCAACATA 
CTTGCATTTC CAACTTTACC TCCAAAGGCA ACAGATAAGA TTAGTTTTGA CGGGAACCTA 
AGCGCGGATA CAAAAATATA TTCAGGTCAA ATAACAAAAT TTGAAGATTT ATTGAACGTG 
CCTGCCGATA GCAAATATTC AACAAGTTTT AAGATTTTCG ATTCACAGGG CAAAGAACAC 
ACGTTACAGC TCACTTTTAT AAAAACAGGC GATAACACAT GGGAATGGTT TGTGGATGCT 
CCGAGGGTAA AGAAGAATAT AGGTACTGCC CAAAATCCAC AAGAAGCATA TGTATATGTT 
GATGATATGA TAGAGGCAAA CAATGACTAT GACAACTTTA TTGCAAGAGG AACAATAACA 
TTTGGACAAG CAGGAAAGGT GCTTGATGAT GAAAATACAC CTGATGTAGA AGGAATTGCT 
ATAACGGGTG GAAGGTTTAT TAATACACAA AACGGTACAT TTACAATTAA TTTCAAGAAC 
AATGTTGTGA ATCCTGTTAC ATTAAAAGTT AATAGTTCTC AGTTTGATGT GAATGATGCC 
ACAAACATTG CCTTTTTCTT GAAGAATATA ACTCAATTTG GTAATATGGA AAGTTCAATA 
AGAGTTGCGC AGATGACAGG GTACAGTGCA GGAAGTCTTC AAGGATTTAA CGTTGATGCA 
TCAGGTAAGA TAACAGGTGT ATATTCAAAT GGTTTGAACC AGCTAATTGG TCAGATTGCG 
ATTGCAACAT TTGCAAACCC TGCAGGACTT CAGCGAATAG GCGATAATCT TTATATAAAC 
ACAGTAAACT CAGGTGACCC TGAGATTGGA ACACCTGGGT CTGGCTCAAG AGGTACAATA 
TCTCAGGGAA CGCTTGAGAT GTCAAATGTG GACTTAGCAA AAGAATTTAC AGACATGATA 
GTAACTCAGA GAGGGTATCA GGCAAACGCA AGGGTGATAA CTGCATCAGA TGAACTTTTG 
CAGGATTTGG TCAATATTAA AAGGTAA

Protein sequence

MMRSMFSSIS ALRAHQTRMD VIGDNIANVN TVGFKSSRVT FASVFASVLK SASAPDTASG 
RGGSNPMQIG LGVSVASVDM NMTRGSLQRT DNPTDLAIEG DGFFVVGGDG KAPRFTRAGN 
FSLDKMGNLV TATGLNVLGW MYDPVNNQID TTKSPSKINI LAFPTLPPKA TDKISFDGNL 
SADTKIYSGQ ITKFEDLLNV PADSKYSTSF KIFDSQGKEH TLQLTFIKTG DNTWEWFVDA 
PRVKKNIGTA QNPQEAYVYV DDMIEANNDY DNFIARGTIT FGQAGKVLDD ENTPDVEGIA 
ITGGRFINTQ NGTFTINFKN NVVNPVTLKV NSSQFDVNDA TNIAFFLKNI TQFGNMESSI 
RVAQMTGYSA GSLQGFNVDA SGKITGVYSN GLNQLIGQIA IATFANPAGL QRIGDNLYIN 
TVNSGDPEIG TPGSGSRGTI SQGTLEMSNV DLAKEFTDMI VTQRGYQANA RVITASDELL 
QDLVNIKR