Gene EcolC_3384 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3384
Symbol
ID	6067568
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3703400
End bp	3704386
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	52%
IMG OID	641602798
Product	putative sigma54 specific transcriptional regulator
Protein accession	YP_001726330
Protein GI	170021376
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3829] Transcriptional regulator containing PAS, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.399889
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAC TTATTGCAAC TGCCGCTTCC AGCATTAACG CTTTTACTCT GGCAAAGCGT 
GTCGCCGCAT TTAACGTGCC GGTGCTCATT CAGGGCGAAA CCGGCGCGGG CAAAGAATGC 
GTGGCGAAAT ATATTCACAC CGTAGCCTTT GGTGAAAATG ATAACGCGCC CTATATCGGC 
GTGAACTGCG CGGCGATCCC AGAAAATATG CTGGAAGCGA CCTTATTTGG CTACGACAAA 
GGCGCATTTA CCGGCGCAAT TGCCAGCGTA CCTGGAAAAA TGGAACTGGC GAATAACGGC 
ACCTTATTGC TCGATGAAAT TGGCGATATG CCGCTGGCAT TACAGGCCAA AATATTACGC 
GTATTGCAGG AACAGCTGGT TGAGCGATTA GGCAGCAACC GACAAATTAA ACTCAATTTT 
CGCCTGATTG CCTGCACCAA TAAAAACCTT GAACAGGAAG TCGCTGCCGG GCGTTTTCGT 
GAAGATCTCT ATTATCGCCT GGCGGTTATT CCTATTACCA TGCCGCCGCT GCGTGAACGT 
CTGAACGATA TTATTCCGCT GGCAGAGTCA TTTATTAAAA AATACTCCAC GGTGCTGGTG 
AAAAATATCA CCCTTTCAGA ATCTACCCGC CGGGCGCTGC TCAATTACCG CTGGCCCGGC 
AACGTGCGCC AGCTGGAGAA CGCCATACAG CGGGGAATGA TCTTAAACCG CGACGGCGTA 
ATTTACCTCG ATGCGTTAGG CCTGCCGGAA AATGACATTG CCGACCGCAG CGAACTGCAA 
TGGCCTGTTC AGCCCGCCGT CCACATTGCC GAAACCAGCG ATTTGGGCCA GCACGGACGA 
AGCGCCCAGT ATCAATATAT CGCTGACCTG ATGCGTAAAT ATCAGGGCAA CCGCAGCAAA 
ATCGCCGACC TGTTAGGCAT TACCCCGCGC GCACTGCGCT ATCGACTGGC CTCCATGCGC 
AAGCAAGGTA TCGAAGTTTT CTCCTGA

Protein sequence

MSELIATAAS SINAFTLAKR VAAFNVPVLI QGETGAGKEC VAKYIHTVAF GENDNAPYIG 
VNCAAIPENM LEATLFGYDK GAFTGAIASV PGKMELANNG TLLLDEIGDM PLALQAKILR 
VLQEQLVERL GSNRQIKLNF RLIACTNKNL EQEVAAGRFR EDLYYRLAVI PITMPPLRER 
LNDIIPLAES FIKKYSTVLV KNITLSESTR RALLNYRWPG NVRQLENAIQ RGMILNRDGV 
IYLDALGLPE NDIADRSELQ WPVQPAVHIA ETSDLGQHGR SAQYQYIADL MRKYQGNRSK 
IADLLGITPR ALRYRLASMR KQGIEVFS