Gene CHU_0228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CHU_0228
Symbol
ID	4185529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cytophaga hutchinsonii ATCC 33406
Kingdom	Bacteria
Replicon accession	NC_008255
Strand	-
Start bp	277701
End bp	278954
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	43%
IMG OID	638070238
Product	hypothetical protein
Protein accession	YP_676860
Protein GI	110636653
COG category	[R] General function prediction only
COG ID	[COG4277] Predicted DNA-binding protein with the Helix-hairpin-helix motif
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.008996
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTCAGACA GCATCCAGGA AAAACTTCAG ATACTTGCAG ATGCAGCGAA ATACGACGTA 
TCCTGCTCTT CAAGTGGCAG CAAACGCAAA AATCACAACA AAGGCTTAGG CGATACGGGC 
AATGGTATCT GCCATACATA TACCGAAGAC GGACGCTGCG TATCGTTGTT AAAGATCCTG 
CTTACAAATG TATGTATCTA CGATTGTGCT TATTGTGTTA CCCGCAAAAG CAACGATATA 
CAGCGCGCAG CTTTTACCGT GCAGGAAGTC GTTGATCTCA CCATCAATTT TTACCGGCGC 
AATTATATTG AAGGATTATT TTTAAGTTCA GGTATTTTTA AAAATGCCGA TTATACCATG 
GAACGCCTGG TACTGATCGC AAAGAAACTA CGCACCGAAC ATAGGTTCAA CGGATACATT 
CACCTTAAAT CCATTCCCGG GGCCAGCGAC GAAATCATGC ATGAAGCAGG CCTCTACGCG 
GACCGCTTAA GCATTAACAT TGAGATCCCT ACTGAAACGG GCTTGAAATT ACTGGCTCCC 
GACAAGAACA GAACCGATAT GATTCAGCCG ATGACGTATC TGAAAAATGA AATCATCCTG 
AAGCAAGATG AAAAAAAACT ATTTAAGAAA GCGCCTGTGT TTGCTCCTGC CGGACAAAGT 
ACGCAAATGA TTATCGGTGC TGCGAAAGAA TCAGATAAAG ATATTATGCA GCTTTCTGCA 
AGCTTTTATA AAAACTTTAA TCTGAAAAGG GTGTACTATT CCGGCTATGT ACCGATCAGT 
AACGACGGAC GATTACCGGG CATTGGCAGT GCCGTGCCTA TGGTACGTGA AAACAGACTA 
TACCAGACGG ATTGGCTGCT GCGCTTCTAT GGCTTTAAGG TAGATGAAAT TGTAAACGAT 
CAGCATCCGA ATCTGGATCT GGATATTGAT CCGAAATTAA GCTGGGCACT GCGCAACCTA 
AATGTTTTTC CTATTGATAT AAACAAGGCC GACATTCAGC TAATCCTTCG TGTACCGGGC 
ATAGGCCTTC AATCTGCACA AAAAATTACT GCAGCGCGAA AGTTTCAGAA ATTAAATTGG 
GAACATCTGA AGAAGATCGG TATTGCGGTA AACCGTGCAA AGTATTTTAT TACCTGCAGC 
AGCAGCGAGT TTGAGCGCAG GGATTTAACG GAGGCACGCA TCAAACAGTT TATATTGTCG 
GGTTCAAGTT CCAAATATTT AAAAACTGCC AGCCAGCAAT TAGTCCTTTT CTGA

Protein sequence

MSDSIQEKLQ ILADAAKYDV SCSSSGSKRK NHNKGLGDTG NGICHTYTED GRCVSLLKIL 
LTNVCIYDCA YCVTRKSNDI QRAAFTVQEV VDLTINFYRR NYIEGLFLSS GIFKNADYTM 
ERLVLIAKKL RTEHRFNGYI HLKSIPGASD EIMHEAGLYA DRLSINIEIP TETGLKLLAP 
DKNRTDMIQP MTYLKNEIIL KQDEKKLFKK APVFAPAGQS TQMIIGAAKE SDKDIMQLSA 
SFYKNFNLKR VYYSGYVPIS NDGRLPGIGS AVPMVRENRL YQTDWLLRFY GFKVDEIVND 
QHPNLDLDID PKLSWALRNL NVFPIDINKA DIQLILRVPG IGLQSAQKIT AARKFQKLNW 
EHLKKIGIAV NRAKYFITCS SSEFERRDLT EARIKQFILS GSSSKYLKTA SQQLVLF