Gene CHU_2103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CHU_2103
Symbol	cel
ID	4186309
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cytophaga hutchinsonii ATCC 33406
Kingdom	Bacteria
Replicon accession	NC_008255
Strand	-
Start bp	2448305
End bp	2449345
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	43%
IMG OID	638072103
Product	endoglucanase
Protein accession	YP_678708
Protein GI	110638499
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2730] Endoglucanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.438737
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAAAA AAATATCCGT AGTGCTTGTC CTTCTTACAG GCATGTTACT TTCCGCTTCG 
GTTTTTGCAC AAAAGACAAT CGTTGAAAAA TACGGTAAGT TGTCTGTAAA AGGAAATTAT 
ATGGTTGGCC AGTACGGTGA TACCGTTCAG CTGAGAGGCA TGTCTTTATT CTGGAGTCAG 
TGGATGGGGC AATACTACAA TTCAGATGTG GTAAAGTGGC TGCGCGACGA TTGGAAATGT 
ACCGTAGTAC GTGCTGCAAT GGGCGTGGAA ATGGACGGAT ACCTTGAAAA TCCGGATACA 
GAAAAAATGA AGGTGATGGA AGTGGTGAAT GCTGCTATTG CCAAAGGCAT TTATGTGATC 
ATTGATTACC ACAGCCACGA AGCGCAGAAG AATCCTGCAG CGGCGCAACG GTTCTTTTCT 
GAGATGGCAA AAAAATACGG GAACATTCCC AATATTATTT ATGAAGTTTA TAATGAACCA 
CTGCAGGCAA CTTCCTGGAA TAAGGACATA AAGCCGTATG CAGAAGGTGT CATTACAAAA 
ATACGTGTGT ATGATACAAC AAACATTATT GTGGTAGGAA CAAGACAATG GTCGCAGCTG 
GTAACAGAGG CGGCAGCGAA TCCGATCACC CGTCAGAACA TCATGTATAC CCTTCATTTT 
TATCCGGGTA CGCACAAGCA GGAATTGCGT AATGAAGCAC AAAAAGCATT GGATATGGGT 
ATTGCCTTAT TTGTTACTGA ATATGGTACC TGCGATGCAT CGGGTAACGG AAATTTCAGT 
CCGGAAGAAA CTGCTTTGTG GTATGAATTT CTGGATGCCC ACAAGATCAG TTATTGCAAC 
TGGTCCATTG CGGATAAGCC CGAAACCGCT TCAGCTATTG TACCGGCAGC AAGTCCGTAT 
GGTGGCTGGG CTGATTATGA TCTTACACCG TCGGGCAAAT TAGTACGCGA TGATCTGCGC 
TTAAAAAATG GACCTATCTT TGACTCACTG GTAAAGACCA GTACTGGCGG AGTGTCTAAA 
AAGAAATCAA AAACAAAATA G

Protein sequence

MIKKISVVLV LLTGMLLSAS VFAQKTIVEK YGKLSVKGNY MVGQYGDTVQ LRGMSLFWSQ 
WMGQYYNSDV VKWLRDDWKC TVVRAAMGVE MDGYLENPDT EKMKVMEVVN AAIAKGIYVI 
IDYHSHEAQK NPAAAQRFFS EMAKKYGNIP NIIYEVYNEP LQATSWNKDI KPYAEGVITK 
IRVYDTTNII VVGTRQWSQL VTEAAANPIT RQNIMYTLHF YPGTHKQELR NEAQKALDMG 
IALFVTEYGT CDASGNGNFS PEETALWYEF LDAHKISYCN WSIADKPETA SAIVPAASPY 
GGWADYDLTP SGKLVRDDLR LKNGPIFDSL VKTSTGGVSK KKSKTK