Gene CHU_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CHU_1039
Symbol
ID	4184375
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cytophaga hutchinsonii ATCC 33406
Kingdom	Bacteria
Replicon accession	NC_008255
Strand	-
Start bp	1198873
End bp	1200108
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	40%
IMG OID	638071037
Product	HC superfamily phosphohydrolase
Protein accession	YP_677656
Protein GI	110637449
COG category	[R] General function prediction only
COG ID	[COG1078] HD superfamily phosphohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.914108
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAATA AGAAGAAAGT TATCAATGAT CCGGTTTGGG GGTTTATAAA TATCCCAACA 
GATCTTATAT TTGAAATCAT ACAACATCCC TACTTTCAGC GACTGCGCAG GATCAGGCAG 
TTAGGGCTAA CGGAAATGGT TTATCCCGGT GCCATACACA CACGTTTTCA CCATGCATTA 
GGCGCCATGC ACTTAATGAC CGAAGCGTTG AAGTCATTAC AAAGCAAAGG CCATACTATT 
TCTTCCGAAG AATTCGAGGG GGCCCAATTG GCCATTCTGC TGCATGATAT CGGCCACGGG 
CCGCTCTCCC ACGCGCTGGA ATATTCCTTA TTAGAAAATA TCAAACACGA AGAGCTTTCC 
AGATTTATTA TGGAAAGCCT GAACGTTACA TACAAAGGCA AGCTGGATCT TGCAATCGCA 
ATCTTTACCA ATACCTACCA CCGTCCGTTT CTGCACCAAC TGGTTTCAAG CCAGCTGGAT 
ATGGACCGGA TGGATTATTT AAGCCGCGAC AGTTTTTTCA CGGGCGTATC CGAAGGAACA 
ATTGGAGCAG ACCGTTTGAT CAAAATGCTT GATCTGCATA ATGACGAACT GGTTGTTGAA 
GAAAAAGGAA TTTACAGTAT TGAAAATTTT TTAACGGCAC GCCGCTTAAT GTACTGGCAG 
GTATATTTAC ATAAGACAAC GGTTAGCGCA GAGAACATGG TGATATCCAT TATAAAACGC 
GCTAAGTTTT TAATGAAAAA CAATACGCTG AGTTATAAGC CGCCATTCTT AGAAGTTTTT 
CTTCAGACAG AAATTACTTT TGAACAGCTG CTTCAGCAAT CTGATCTCTT AAGCGCATTC 
TTAAAACTTG ATGATGTAGA TTTATGGTTC GCTATAAAAC AATGGTCAAA AGAAGAAGAT 
GTTGTTTTAT CAACCATCAG TAAAATGATT CTGGACCGCA AGCTCTTTTC CGTACATATT 
CAACCGGAAC AAATCGGAGC CAACCAAATC GAAACGAACC AAAAACGCTT GCTTTTGACC 
TTTCCGATAA CAACGGCAGA GTTGGATTAT TTTCTGATTC AGGGAACTAT TAGTAATGCG 
GCGTACCTTG CTGAAAATAC TCAAATCAAG GTAAAAATGA AGAATAAAGA AATTTTGGAT 
GTGGCCATAG CTTCTGATTT ACCCAATATT CAGGCGCTGA GCAAAATTGT AACCAAACAT 
TATATTTGCT GTCCAAAAGA TGTATATTTG CAATAA

Protein sequence

MINKKKVIND PVWGFINIPT DLIFEIIQHP YFQRLRRIRQ LGLTEMVYPG AIHTRFHHAL 
GAMHLMTEAL KSLQSKGHTI SSEEFEGAQL AILLHDIGHG PLSHALEYSL LENIKHEELS 
RFIMESLNVT YKGKLDLAIA IFTNTYHRPF LHQLVSSQLD MDRMDYLSRD SFFTGVSEGT 
IGADRLIKML DLHNDELVVE EKGIYSIENF LTARRLMYWQ VYLHKTTVSA ENMVISIIKR 
AKFLMKNNTL SYKPPFLEVF LQTEITFEQL LQQSDLLSAF LKLDDVDLWF AIKQWSKEED 
VVLSTISKMI LDRKLFSVHI QPEQIGANQI ETNQKRLLLT FPITTAELDY FLIQGTISNA 
AYLAENTQIK VKMKNKEILD VAIASDLPNI QALSKIVTKH YICCPKDVYL Q