Gene Ccel_0437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_0437
Symbol
ID	7309319
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	500544
End bp	501503
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	41%
IMG OID	643607367
Product	extracellular solute-binding protein family 3
Protein accession	YP_002504799
Protein GI	220927890
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0271798
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTATTA AAAAGTCTAT TGTAGCTGCT TTGATTTTTG GACTAATTGC AGGTACTGCA 
GCCTGCGGAA ATTCCGGCGG TGTCAAAGAA TCCGGTTTAT CAAATATAAA AACCATAAAA 
ATTGCCTACC TTCCTTTAAC ACATGCTTTG CCTGTGTTTG TGGAGAAAGA ATTGCAGGAT 
AAAAAAGAGA ATAAATATAA AATTGAGCTA GTCAAATACG GGTCATGGCC CGAACTGATG 
GATGCCCTTA ATACAGGCCA TGTCGACGGT GCTTCCGTTC TTATTGAGCT TGCCATGAAG 
GCAAAGGAAC AGAGTATCGG AGTCAAGGCG GTTGCACTGG GTCATAAGGA TGGAAACGTA 
ATTGTTGTTT CCAAAAACAT TAAAAGTCCG TCGGATTTAA AGGGAAAGAA TTTTGCCATT 
CCCCACAGAC AATCCTCCCA TAACATCCTT TTGGGACAAA TGCTCAAAAA TGTCGGACTT 
TCCTACAAGG ATGTAAACAT AGTTGAGCTT CCTCCTCCTG AAATGCCAGC GGCTCTTGCT 
CAAGGTCAAA TAGCCGGATA TAGTGTTGCC GAACCATTTG GAGCAAAGTC TATTGCCCTT 
GATACAGGAA AGGTATTGTT TGAATCCAAT GAACTCTGGA AGGATTCCAT TTGCTGCTCT 
CTGGTTTTGT CCGACAAATT TATTAACAGC AACAAGGATG TGGCAAAAGA GGTTGTATCC 
AGTTTTAGAG ATGCAGGTGA ATACATTGGT TCTCACAAGG ATGAGGCTAA TGCTATTGCA 
AAGAAATACC TTAATCTTGA CGATAAGGTT CTGACCCTGT CCTTAAAATG GATTTCATTC 
AACGACCTCG AAATTACCAG AGAAGCATAT GACAGCCTTA CTTCTAAAAT CAAGGAATTC 
GGGATTTCCT CAAATCCTCC GGCTTATGAT GACTTTGTAG ACTCTAGCCT TTTACGGTAA

Protein sequence

MSIKKSIVAA LIFGLIAGTA ACGNSGGVKE SGLSNIKTIK IAYLPLTHAL PVFVEKELQD 
KKENKYKIEL VKYGSWPELM DALNTGHVDG ASVLIELAMK AKEQSIGVKA VALGHKDGNV 
IVVSKNIKSP SDLKGKNFAI PHRQSSHNIL LGQMLKNVGL SYKDVNIVEL PPPEMPAALA 
QGQIAGYSVA EPFGAKSIAL DTGKVLFESN ELWKDSICCS LVLSDKFINS NKDVAKEVVS 
SFRDAGEYIG SHKDEANAIA KKYLNLDDKV LTLSLKWISF NDLEITREAY DSLTSKIKEF 
GISSNPPAYD DFVDSSLLR