Gene CPS_4021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPS_4021
Symbol
ID	3519913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Colwellia psychrerythraea 34H
Kingdom	Bacteria
Replicon accession	NC_003910
Strand	-
Start bp	4223901
End bp	4224962
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	39%
IMG OID	637286467
Product	AraC family transcriptional regulator
Protein accession	YP_270679
Protein GI	71279454
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.322888
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCATTAG TACCATCAAC TAGCAGTCAG GCACAGATAA AATGTAAACA TATTGGTTTT 
TTATTACAAC CCAACTTTAC CATGTTAGCG TTGTCCTCGG CAATTGCGCC ATTGCGAATG 
GCCAATCAAT TGTCTGGAGA ACAACTATAT CGTTGGACTA TTCTCAGTGA AGATGGCGGC 
GTTGTTACTG CCAGTGATGG ACTGAAGATC GAGGTTGATT CTTGCATCAA TAACTATGTT 
GAGTTTGATA CTGTGTTGGT TTGTGGCGGT GTAGATATAA AAGGCACAGT GACGCGAAAA 
GTGCTTAGCT GGTTAACCCA TTTATCTCGC TGTAATATCG TGCTAGGCGG CATTTGCACG 
GGCAGTTATT TATTGGCTAA AGCGGGTTTA TTAAACGGCT ATCAAAGCAC CATTCATTGG 
GAATTGTTGG CGAGTTGTCA GGAAGAGTTC CCTTTAATAA AAAGCTCCAA TCAATTGTTT 
ATACTTGACC GTAATCGCAT GACTTGTTCA GGCGGTACAG CACCTATTGA TATGATGTTG 
CAGGTGATTT CTAAAGAGTA CGGTAAAGCT TTAACAACGG CTATTTCAGA CATGTTTTCT 
CATGAACATA TTCGTGATGA AAACGACCAG CAACGCATAC CATTACAGCA TATTGTTGGT 
GCTACTCAGT CAAAATTGCA AGATGTAGTC GCGTTAATGG AAGCAAATAT TGAAGAAATA 
TTATGCCTAG ATGAATTAGC TAGTTTTGTT GATTTATCTC GACGTCAGTT AGAGCGATTG 
TTTCAAAAAT ATCTCAACTG TTCGCCGCAT CGTTATTATT TACAGTTACG ATTAGGAAAA 
GCACGTCAGT TATTAAAGCA AACCAATATG TCTATTATTG AAATTGCTAT AGCATGTGGT 
TTTGTTTCTA CGCCGCATTT TAGTAAGTGT TATCGTAATT CTTTTAGCAT TCCGCCCCGA 
GATGAGCGCA ACGTTTTAGC TAAAAATAAG CAATTTGCTT CCAGTAAAGA ATCCAGCTTG 
GGATCGGTTA AGGTTCAACA TCAACATCAA CAACATCACT AA

Protein sequence

MPLVPSTSSQ AQIKCKHIGF LLQPNFTMLA LSSAIAPLRM ANQLSGEQLY RWTILSEDGG 
VVTASDGLKI EVDSCINNYV EFDTVLVCGG VDIKGTVTRK VLSWLTHLSR CNIVLGGICT 
GSYLLAKAGL LNGYQSTIHW ELLASCQEEF PLIKSSNQLF ILDRNRMTCS GGTAPIDMML 
QVISKEYGKA LTTAISDMFS HEHIRDENDQ QRIPLQHIVG ATQSKLQDVV ALMEANIEEI 
LCLDELASFV DLSRRQLERL FQKYLNCSPH RYYLQLRLGK ARQLLKQTNM SIIEIAIACG 
FVSTPHFSKC YRNSFSIPPR DERNVLAKNK QFASSKESSL GSVKVQHQHQ QHH