Gene Cpin_4056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpin_4056
Symbol
ID	8360229
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chitinophaga pinensis DSM 2588
Kingdom	Bacteria
Replicon accession	NC_013132
Strand	+
Start bp	5045108
End bp	5046364
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	46%
IMG OID	644966228
Product	Radical SAM domain protein
Protein accession	YP_003123717
Protein GI	256423064
COG category	[R] General function prediction only
COG ID	[COG4277] Predicted DNA-binding protein with the Helix-hairpin-helix motif
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.153991
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.0464079
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAGGA TACAGGAGAA ACTTGCGATA CTGGCAGATG CGGCGAAATA TGATGCGTCG 
TGTGCTTCGA GTGGCAGTAA CCGGAAAAAC GAAACCAAGG GATTGGGCAA TGCGCATCCG 
GGTATGGGAA TTTGTCATTC ATATACAGCA GATGGTCGTT GTGTGTCGTT ACTGAAGATA 
TTGCTGACAA ATGTCTGCAT TTATGATTGT GCCTACTGTG TATCCCGTAG AAGTAATGAT 
ATTAAGCGGG CGGCATTCAC GGTACAGGAA GTAGTAGACC TGACCATAAA CTTTTACCGT 
CGGAACTATA TAGAGGGGCT TTTTTTGAGT TCCGGTATTT TTAAAGATCC GGATTATACG 
ATGGAGAGGT TAGTGAGAGT GGCTAAAAAG CTTCGAACGG AGCATAATTT CAATGGATAT 
ATTCATTTGA AAGCGATTCC TGGTGCAAGT GATGAATTAA TGAGAGAGGC GGGGTTGTAT 
GCAGATCGTT TGAGCGTCAA TTTAGAGTTG CCGACAGAAG CAGGGTTAAA ATTGCTGGCT 
CCGGAGAAGA ACCGGCCGGC TATGATTCAA CCGATCCGTT TTTTGCAGAA TGAGATTATT 
CGGCTGGAAG ATGAACGGAA GGTGTTGAAG AAGGTGCCGA CTTTTGTTCC GGCAGGACAG 
AGTACGCAGG TAATAGTAGG TGCGGCGGGT GAGTCGGATA TGGAAATCAT GCACCTGGCT 
TCCCGTTTTT ATAGACAATT CCAGCTGAAA CGTGTGTATT ATTCTGGCTA TGTGCCGATC 
AGCAATGATA ACAGATTACC TGCCTTACAT AGCCAGGTGC CGTTGATGCG GGAAAACCGG 
TTGTATCAGG CTGACTGGCT CTTACGTTTT TATGGTTTTG AACCTCATGA ATTATTGAAT 
GAAAGACATC CGAATCTTGA TACGGATATT GACCCCAAAC TCTCCTGGGC GTTACGGAAT 
CTGGACAGTT TTCCAGTAGA CATTAATAAG GCTGATAAGA TGCTGATTGC CAGGGTACCG 
GGCATCGGTA TTGAAAGTCT GCGTAAAATA TGCGCAGCGC GTATGCATGG TACACTGAAT 
TGGGATCAGC TGAAACAGAT GGGTGTTCAG ATTGGAAAGG CGAGATATTT TATTACGTGT 
AAATCCGGTC CTCTCGAAAG ACGGGATCTG ACACCGGAAC AGATACGTCG GCAACTGCTG 
GCACAGTCCC ACAGTAAATG GGCGAAAGCT CATAGTCCGC AGTTGCAGTT ATTTTGA

Protein sequence

MERIQEKLAI LADAAKYDAS CASSGSNRKN ETKGLGNAHP GMGICHSYTA DGRCVSLLKI 
LLTNVCIYDC AYCVSRRSND IKRAAFTVQE VVDLTINFYR RNYIEGLFLS SGIFKDPDYT 
MERLVRVAKK LRTEHNFNGY IHLKAIPGAS DELMREAGLY ADRLSVNLEL PTEAGLKLLA 
PEKNRPAMIQ PIRFLQNEII RLEDERKVLK KVPTFVPAGQ STQVIVGAAG ESDMEIMHLA 
SRFYRQFQLK RVYYSGYVPI SNDNRLPALH SQVPLMRENR LYQADWLLRF YGFEPHELLN 
ERHPNLDTDI DPKLSWALRN LDSFPVDINK ADKMLIARVP GIGIESLRKI CAARMHGTLN 
WDQLKQMGVQ IGKARYFITC KSGPLERRDL TPEQIRRQLL AQSHSKWAKA HSPQLQLF