Gene Cthe_1576 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1576
Symbol
ID	4809567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	1904910
End bp	1905977
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	47%
IMG OID	640106994
Product	basic membrane lipoprotein
Protein accession	YP_001037995
Protein GI	125974085
COG category	[R] General function prediction only
COG ID	[COG1744] Uncharacterized ABC-type transport system, periplasmic component/surface lipoprotein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	58
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT TTCTGGCATT ACTATTATCC GTTATAATAG TCTTTTCCCT GACTGCATGT 
GGCGGAAAAA ATTCCGGCAA CAACAGCAAT AACAGCAGTA ATAACAACAG CAGCAACAAT 
ACCGGGGGCA AGAAGATTAA GATTGGTATG GTTACCGATG TTGGCGGTGT AAACGACGGC 
TCATTCAACC AGTCTGCCTG GGAAGGTCTG CAGCGCGCTC AAAAAGAACT TGGTGTAGAA 
GTTCGCTATG CCGAATCTGC AACCGATGCC GACTATGCTC CCAACATTGA GGCTTTCATT 
GATGAAGGCT ATGACCTCAT CATCTGTGTA GGATACATGC TGGCTGATGC CACCAGAAAA 
GCAGCTGAAG CCAATCCAAA TCAGAAATTT GCCATCATTG ACGATGCTTC CATCGATTTG 
CCCAACGTTA CCTGCCTGAT GTTCGAGCAG AGCCAGGCTT CCTACCTGGT TGGCCTTGTT 
GCCGGTAAAA TGACCAAAAC AAACAAAGTA GGATTTGTTG TCGGTATGGT CAGCCAGACC 
ATGAACGAAT TCGGTTACGG GTATCTTGCC GGCGTGAAAG ATGCCAACCC CAATGCTACT 
ATCCTGCAGT TCAACGCTAA CTCTTTCAGC AGCACCGAAA CCGGTAAATC CGCTGCTACC 
ACAATGATCA CCAACGGCGC GGATGTAATC TTCCACGCAG CTGGCGGAAC GGGCTTAGGC 
GTAATCGAAG GCTGTAAAGA CGCAGGCAAA TGGGCAATCG GTGTAGACAG CGACCAGTCC 
CCGCTTGCTC CTGAAAACAT TCTGACCTCT GCTATGAAAC GCGTTGACAA TGCATGCTTT 
GATATTGCCA AAGCCGTAAA GGAAGGCAAT GTTAAGCCTG GCATCATCAC GTATGACTTA 
AAGTCCGCAG GTGTAGACAT CGCTCCTACC ACCACCAACC TGCCAAAGGA AGTTCTCGAT 
TATGTAAACC AAGCTAAGCA GGACATCATC AACGGTAAAA TTACCGTTCC GAAGACCAAG 
GCTGAGTTTG AAGCAAAATA CGGCAACATA TACGAATTAG ACGACTAA

Protein sequence

MKKFLALLLS VIIVFSLTAC GGKNSGNNSN NSSNNNSSNN TGGKKIKIGM VTDVGGVNDG 
SFNQSAWEGL QRAQKELGVE VRYAESATDA DYAPNIEAFI DEGYDLIICV GYMLADATRK 
AAEANPNQKF AIIDDASIDL PNVTCLMFEQ SQASYLVGLV AGKMTKTNKV GFVVGMVSQT 
MNEFGYGYLA GVKDANPNAT ILQFNANSFS STETGKSAAT TMITNGADVI FHAAGGTGLG 
VIEGCKDAGK WAIGVDSDQS PLAPENILTS AMKRVDNACF DIAKAVKEGN VKPGIITYDL 
KSAGVDIAPT TTNLPKEVLD YVNQAKQDII NGKITVPKTK AEFEAKYGNI YELDD