Gene Cpin_4147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpin_4147
Symbol
ID	8360320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chitinophaga pinensis DSM 2588
Kingdom	Bacteria
Replicon accession	NC_013132
Strand	+
Start bp	5174052
End bp	5175368
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	43%
IMG OID	644966318
Product	transcriptional regulator, AraC family
Protein accession	YP_003123807
Protein GI	256423154
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0286987
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.311664
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGGTA CTGGTTTTCA TCAAGATAAC ATTGTGATAA CATTGTTTTT ATATTTTAGC 
AACACGAGCA CACATATGAT CTATGTTATT GCAATAGGGA CTTTCCAGGC ATTTACAGCC 
GTTCTATTAC TATGGACGAA CAGATTGAAA AGTAAGGCGG ACGCTTTGCT TATTTTGCTG 
TTGTTATGTA TTGCCGCCCA TCTGGCGACA AAATTCTATA TCTATACTGT TGTCAGTGAT 
GCGCATATCC GGTTACAGAT GAACACCTTC ATTGGTTTCT GTTATGGTCC GCTGCTTTAT 
CTATATACAC TTAAAAATAA AGATGAATCG TTCATTCCTG CGTCGCGTTG GTATGTGTTC 
ATTCCGTTTA TATTAGGTGC GATCGGTTAT CTGACTGTCG TATGTGTACT GGAATTCTCT 
TTACAGGCGG GATATGCGGC TTTGCTGGTC TATAATCAGA TTTCGACCTG GACGATGTTA 
GCTGCCGGCG CGTTTTTTCC TATGCTGACG CTCCGGGTCG CGCGAAAAAA TCTGCGCAAT 
AAACCACAGG AGTTACAGCT GATAGAATGG ATCTCTTATT GTTTGTTAGC GATCACCGTT 
GTTTCACTTA TTTTTCAGGG TATCAATGCA TTGCACCTGT TAGGATATCA GGACCAGATC 
TTTTGCAGGG ACATTATATA TTCGATCCTG CTGGTGGTGT GTTTTATCAT TATCCGTTAT 
AAATATGTGG CAGTCGTTCC GCCGGCGATG TATGTGGAAA CAGTTGTAAT ACCAGCCATT 
CAGGAAGAGA TACCTGCAGA GAAGGCAAAT GTGATCGATA TACCGGAAGC TGTAATGGAA 
ATTGAACCAT TACCGGCGCA TGTTGCGATA GTACAGGATT CGGCGATAGA CGATGAAGAT 
ATCAGTGCAC AGTCCTCTCC TGTTCGCAGA ACCCAATTGT CGATTACCGA GCATCGTGAG 
ATCATGGATA AGCTGGAACA ACACCTGCAA CGAACAAGGA TATTTACGGA TGCGGATCTG 
AATATGGATA AACTGGCGGG TTCCGTTGGC ATCAGCAAAT ACCATCTTTC CGAAGCGTTG 
AATTCCTATG CTTCCAAAAG CTTTTATCAG TTTATTAATG AAATGCGCAT CGAACGAGCT 
ATCCAACAGA TGCAGTTTAT GAGTAGCAGA GCGCTTCCTG TAAATGTACT GACCCTCGCT 
TTTGATTGCG GCTTCAAGGC CAAGTCTTCG TTTAATCAGT ATTTTAAGAA AATAACGGGG 
CTGACGCCCA CGGCATACCT CCGTTCCGTC GCCGAGATGC GGACTGAAAC ATTGTAA

Protein sequence

MFGTGFHQDN IVITLFLYFS NTSTHMIYVI AIGTFQAFTA VLLLWTNRLK SKADALLILL 
LLCIAAHLAT KFYIYTVVSD AHIRLQMNTF IGFCYGPLLY LYTLKNKDES FIPASRWYVF 
IPFILGAIGY LTVVCVLEFS LQAGYAALLV YNQISTWTML AAGAFFPMLT LRVARKNLRN 
KPQELQLIEW ISYCLLAITV VSLIFQGINA LHLLGYQDQI FCRDIIYSIL LVVCFIIIRY 
KYVAVVPPAM YVETVVIPAI QEEIPAEKAN VIDIPEAVME IEPLPAHVAI VQDSAIDDED 
ISAQSSPVRR TQLSITEHRE IMDKLEQHLQ RTRIFTDADL NMDKLAGSVG ISKYHLSEAL 
NSYASKSFYQ FINEMRIERA IQQMQFMSSR ALPVNVLTLA FDCGFKAKSS FNQYFKKITG 
LTPTAYLRSV AEMRTETL