Gene EcHS_A3571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3571
Symbol
ID	5594550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3549280
End bp	3550365
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	57%
IMG OID	640922688
Product	hypothetical protein
Protein accession	YP_001460169
Protein GI	157162851
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	65
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGACGT TTCCTCTGCA AAGCCTGACG ATTATTGAGG CGCAGCAAAA GCAGTTTGCG 
CTGGTGGATA GCATTTGTCG CCATTTCCCC GGCAGCGAGT TTCTTACTGG CGGTGATTTA 
GGCTTAACGC CAGGACTGAA TCAACCGCGC GTTACCCAGC GTGTGGAACA GGTGCTGGCT 
GATGCATTTC ACGCACAGGC TGCGGCGCTG GTGCAGGGCG CGGGGACTGG CGCGATTCGC 
GCCGGGCTGG CGGCTTTGCT CAAACCGGGG CAGCGTCTTC TGGTGCATGA CGCGCCTGTT 
TACCCGACGA CACGGGTTAT TATTGAGCAG ATGGGGCTGA CGCTTATTAC TGTTGATTTC 
AATGACCTGT CGGCACTGAA GCAGGTCGTC GACGAGCAAC AACCGGATGC GGCGCTGGTG 
CAGCATACGC GCCAGCAGCC GCAGGACAGC TACGTGCTGG CAGATGTGCT GGCAACGTTG 
CGCGCGGCAG GTGTTCCAGC GTTAACCGAT GACAACTATG CGGTGATGAA GGTGGCGCGA 
ATCGGCTGTG AATGCGGCGC GAATGTCTCG ACATTTTCCT GCTTCAAGCT ATTTGGGCCA 
GAGGGTGTTG GTGCAGTGGT CGGCGATGCT GATGTTATCA ACCGTATTCG CGCCACGCTT 
TACTCAGGCG GTAGCCAGAT CCAGGGCGCT CAGGCGCTGG AAGTCTTGCG TGGTCTGGTG 
TTTGCGCCAG TGATGCACGC GGTGCAGGCG GGGGTATCTG AACGGTTGCT GGCTTTGCTC 
AACGGTGGTG CAGTGCCGGA AGTGAAAAGC GCCGTCATTG CTAATGCGCA GTCGAAGGTA 
TTGATTGTGG AGTTTCATCA GCCGATTGCC GCCAGGGTGC TGGAAGAAGC GCAGAAACGC 
GGTGCCTTAC CTTACCCGGT CGGTGCAGAG TCGAAATATG AAATCCCGCC ACTTTTTTAT 
CGACTTTCCG GGACGTTTCG CCAGGCGAAT CCACAGCTCG AACATTGCGC GATTCGCATT 
AACCCGAATC GCAGCGGTGA AGAGACGGTG CTGCGGATTT TGCGTGAGAG TATTGCCAGT 
ATTTAA

Protein sequence

MKTFPLQSLT IIEAQQKQFA LVDSICRHFP GSEFLTGGDL GLTPGLNQPR VTQRVEQVLA 
DAFHAQAAAL VQGAGTGAIR AGLAALLKPG QRLLVHDAPV YPTTRVIIEQ MGLTLITVDF 
NDLSALKQVV DEQQPDAALV QHTRQQPQDS YVLADVLATL RAAGVPALTD DNYAVMKVAR 
IGCECGANVS TFSCFKLFGP EGVGAVVGDA DVINRIRATL YSGGSQIQGA QALEVLRGLV 
FAPVMHAVQA GVSERLLALL NGGAVPEVKS AVIANAQSKV LIVEFHQPIA ARVLEEAQKR 
GALPYPVGAE SKYEIPPLFY RLSGTFRQAN PQLEHCAIRI NPNRSGEETV LRILRESIAS 
I