Gene Cthe_0440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0440
Symbol
ID	4808368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	554592
End bp	555995
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	40%
IMG OID	640105854
Product	hypothetical protein
Protein accession	YP_001036871
Protein GI	125972961
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0769] UDP-N-acetylmuramyl tripeptide synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATAA GACTTATTTT CACAATAATT GTTACAAAAC TCCTTATTCT TGCATTAAGA 
ATTTTAAAAA GGGGAGGAAC TTCTCTTCCG GGAAAAGTCG CGTATAAAAT TTACCCGGAC 
ATAATTAAGG TAATTTCAAA AGATTTTAAA ATAATAATGG TTACGGGAAC AAACGGCAAG 
ACCACCACTA CCCGTATAAT CGGAAAAGTA CTTGAGGAAA ACAATATAGA GTACATTACC 
AACAAATCCG GTGCCAATCT GGTAAGCGGT ATTATTACCA CTTTTATTGA ATCTGTAAAT 
ATTTTCGGAA AAAGCAAAAC TTCCACAGCA TTGCTGGAAG TTGACGAGGC TGCCTTCAAT 
GTGGTAACCG ACTACGTTCA GCCGGATGTT TTGGTGGTAA CAAACTTTTT CAGGGACCAG 
TTGGACCGAT ATGGTGAGCT CTACACCACT GTAAGCAATG TCAGATCAGG CATCGAAAAG 
TCACCGAATG TCAAGCTGGT TTTAAATGCA GACGACTCTC TTTGTGCATC ATTAGGTCAC 
AATATGGACA GAGAGGCCAT ATACTACGGT TTTTCTGAGG AAGCGTACAA CAACAGCAGC 
ACAGTTGTAA ACAGTGATGC AAGCATTTGC CTTTACTGCA AAAGCAAATA TGAGTACTCC 
TACAATGTAT ATGGCCATCT TGGGGGATTT TCCTGTCCAA ACTGCGGATA TATGCGACCT 
GATTCCAAGG TAACATGCGT AAAAATTAAC GAGCTTAACA CTTCGTATTC CGATATCATA 
TTTTCATTAA GTCCAATAAA GGGCAATGAC GAGCCGGTTT CATACAACGC CAGAATTAAT 
CTTCCCGGAC TTTATAACAT ATATAACGCA CTGGCTGCGG CGTCCCTGGG ACATCTTTCA 
GGCTTTTCGC CGGAAAGCCT TGTAAAAGCC ATGGAAAGTT TCGAATGCGG TTTTGGACGA 
ATGGAAACCA TCGAAACCGA CGGTAAAACC ATAAAGGTTA TTCTGGTTAA AAACCCAACC 
GGCTTTAATC AGGTTTTAAG TTATCTTCTT ACGGAAAAGC AAAATACTCA AATAGCCTTT 
GTTATAAATG ACCGCCTTGC AGACGGCACC GATATTTCGT GGCTGTGGGA TGTTGATTTT 
GAGCAGCTTC AGCAAATGCA GGACAAAGTA TCCAGCTTTT ATGCTTCAGG AATCCGTGCG 
GAGGATATGG CTGTAAGGCT TAAATATGCA GGAATAAACA TCGATAAGAT TCAGATTGAA 
AAAGACTATG AAGAGCTTCT CAATAAAGCT TTAGCCACTA CTTCAGAAGG GCAGAATCTT 
TATATACTGC CCACCTATAC CGCAATGCTT GAAGTAAGAA GCCTTCTGGA GAAAAAATTC 
GGTTTAAAGG AGTTTTGGAA ATAA

Protein sequence

MNIRLIFTII VTKLLILALR ILKRGGTSLP GKVAYKIYPD IIKVISKDFK IIMVTGTNGK 
TTTTRIIGKV LEENNIEYIT NKSGANLVSG IITTFIESVN IFGKSKTSTA LLEVDEAAFN 
VVTDYVQPDV LVVTNFFRDQ LDRYGELYTT VSNVRSGIEK SPNVKLVLNA DDSLCASLGH 
NMDREAIYYG FSEEAYNNSS TVVNSDASIC LYCKSKYEYS YNVYGHLGGF SCPNCGYMRP 
DSKVTCVKIN ELNTSYSDII FSLSPIKGND EPVSYNARIN LPGLYNIYNA LAAASLGHLS 
GFSPESLVKA MESFECGFGR METIETDGKT IKVILVKNPT GFNQVLSYLL TEKQNTQIAF 
VINDRLADGT DISWLWDVDF EQLQQMQDKV SSFYASGIRA EDMAVRLKYA GINIDKIQIE 
KDYEELLNKA LATTSEGQNL YILPTYTAML EVRSLLEKKF GLKEFWK