Gene CHU_0854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CHU_0854
Symbol
ID	4184213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cytophaga hutchinsonii ATCC 33406
Kingdom	Bacteria
Replicon accession	NC_008255
Strand	+
Start bp	978072
End bp	979172
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	35%
IMG OID	638070856
Product	capsular polysaccharide biosynthesis protein
Protein accession	YP_677477
Protein GI	110637270
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4421] Capsular polysaccharide biosynthesis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0933972
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.113997
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTGTCTTC AACGGATCTG TTACGAAAAG ATTTTTTTGA AAAAGAAAAT AATAGCAACT 
GGAACAATCT GGATGAGTAA CATGCAGCAA ATAAATAATG CTTCTGTAAG GCCTGTTAGT 
GCTTACAATA CAAAGCATCT GCAAATACCT GCAATTGCAT TGCTTCAATC TTCTCCATTG 
CCTGAACAGG CCATACGTAC ATTTAGCAGG GCGCTTCTGA CACCAACAAA CCATTTATTC 
GTAAATGGCA GATACATTCG CACCGGATTA ATTTCCGGTT TCGATTCAAG AAAGCTTTCT 
TTTTTTCAAA GAATATATTT ATTCTTAAAA TCACGATTTT TTACAGAAAA TAAATCAGTT 
AAAATTTCAG CAGTATGGGC GCATGATAGC TGGAGTAATA ATTATTTCCA CTGGTTTAAT 
GACACGTTGC CTCGATTATT TTTATTGAGT AAACAAATTG AAGACTCGGT TGCGGTATTG 
CCTGTTGAAT TAAGTAAGAT CACATTCATT GTTGAATCAT TGGAGTTACT TAAAATTGAA 
CATCAATGGA TTGATCAGAA AAAGTCTCAT CGGTTTGAAT CGTTAAGTGT ATTACATACG 
GCAACACTTC AGCCTGACAT TAATCCGTTG CTTCAAAAAC AGATGCGCGA CGCTGTTTTT 
TCAGCAATGA AAATTGACCC GCAAGAAAGA CCTTTCAGGA AAATATATAT TTCGAGAGCA 
CATGCGAGGT ATAGGAAAAT TATAAATGAA CAGGAATTAT TGCCTGTACT GAAAAAATAT 
GGATATGATA TTATTTATCC TGAAACATAT TCTTTTAAAG AACAGGTAAA ACTTTTTGCT 
GAGTCAAATG CGTTAATTTC TATTCATGGA GCAGGGCATA CAAACTGCAT GTTTATGAAG 
CAAGATGCTA AAGTGATGGA AATACGAAAT ACTGAATGGG AGTCGCAGCC ACTTTGCTTC 
TGGGGGTTGG CAAATATTTT TGAATTAAAG TGGGAATATA TTACAGCCAC ACGGGTAAGT 
GAAGTTTCGA ATTTTAATGA TGTTTTTATA GCTCCACATA TATTTGAAGA ATCGTTACGG 
ACATTTGAAA ACATTAAATA A

Protein sequence

MCLQRICYEK IFLKKKIIAT GTIWMSNMQQ INNASVRPVS AYNTKHLQIP AIALLQSSPL 
PEQAIRTFSR ALLTPTNHLF VNGRYIRTGL ISGFDSRKLS FFQRIYLFLK SRFFTENKSV 
KISAVWAHDS WSNNYFHWFN DTLPRLFLLS KQIEDSVAVL PVELSKITFI VESLELLKIE 
HQWIDQKKSH RFESLSVLHT ATLQPDINPL LQKQMRDAVF SAMKIDPQER PFRKIYISRA 
HARYRKIINE QELLPVLKKY GYDIIYPETY SFKEQVKLFA ESNALISIHG AGHTNCMFMK 
QDAKVMEIRN TEWESQPLCF WGLANIFELK WEYITATRVS EVSNFNDVFI APHIFEESLR 
TFENIK