Gene ECD_03983 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_03983
Symbol	basS
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	4239260
End bp	4240351
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	54%
IMG OID
Product	sensory histidine kinase in two-component regulatory system with BasR
Protein accession	ACT45773
Protein GI	253980103
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATTTTC TGCGCCGACC AATATCGCTG CGCCAACGGC TGATATTGAC CATCGGGGCC 
ATTTTGTTGG TGTTTGAGCT GATCAGCGTC TTCTGGCTAT GGCATGAAAG TACCGAGCAG 
ATTCAGCTGT TTGAGCAGGC GCTACGCGAC AATCGCAACA ACGATCGCCA CATCATGCGT 
GAGATCCGCG AGGCGGTCGC CAGCCTGATT GTCCCCGGCG TCTTTATGGT CAGCCTGACG 
CTATTTATCT GCTATCAGGC GGTACGCCGC ATCACCCGCC CGCTGGCGGA GCTGCAAAAA 
GAGCTGGAAG CGCGCACCGC CGACAACTTA ACGCCCATTG CCATTCACAG CGCCACCCTC 
AAAATCGAAG CGGTGGTTTC GGCGTTAAAC GATCTGGTCA GTCGCCTGAC CAGCACGCTG 
GATAACGAAA GGTTGTTTAC CGCTGACGTC GCGCACGAAC TGCGAACGCC ACTGGCGGGG 
GTGCGTTTGC ATCTGGAACT GCTGGCGAAA ACGCATCACA TTGATGTAGC ACCGTTAGTG 
GCACGGCTTG ATCAGATGAT GGAGAGCGTC TCCCAGCTGC TGCAACTGGC GCGTGCCGGA 
CAGTCATTTT CTTCCGGTAA TTATCAACAT GTAAAACTGC TGGAAGATGT CATTCTCCCC 
TCGTATGACG AACTCAGTAC CATGCTCGAC CAGCGACAGC AAACCCTGCT ATTGCCAGAG 
AGCGCCGCCG ACATCACCGT TCAGGGTGAT GCAACCCTGC TGCGGATGTT ATTGCGAAAC 
CTGGTAGAAA ACGCCCATCG TTACAGCCCG CAAGGCAGCA ACATTATGAT TAAGCTGCAA 
GAAGATGACG GAGCGGTCAT GGCAGTTGAA GATGAAGGAC CAGGTATTGA TGAGAGTAAA 
TGCGGGGAGT TGAGTAAAGC GTTTGTACGT ATGGACAGCC GTTATGGCGG GATTGGTCTG 
GGGTTAAGTA TTGTCAGCCG CATTACACAG TTGCATCACG GGCAGTTTTT CCTGCAAAAC 
CGGCAAGAGA CTTCCGGCAC GCGGGCCTGG GTACGGCTGA AGAAAGATCA GTACGTGGCA 
AACCAGATAT AA

Protein sequence

MHFLRRPISL RQRLILTIGA ILLVFELISV FWLWHESTEQ IQLFEQALRD NRNNDRHIMR 
EIREAVASLI VPGVFMVSLT LFICYQAVRR ITRPLAELQK ELEARTADNL TPIAIHSATL 
KIEAVVSALN DLVSRLTSTL DNERLFTADV AHELRTPLAG VRLHLELLAK THHIDVAPLV 
ARLDQMMESV SQLLQLARAG QSFSSGNYQH VKLLEDVILP SYDELSTMLD QRQQTLLLPE 
SAADITVQGD ATLLRMLLRN LVENAHRYSP QGSNIMIKLQ EDDGAVMAVE DEGPGIDESK 
CGELSKAFVR MDSRYGGIGL GLSIVSRITQ LHHGQFFLQN RQETSGTRAW VRLKKDQYVA 
NQI