Gene EcolC_1003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1003
Symbol
ID	6067653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1091773
End bp	1093287
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	57%
IMG OID	641600411
Product	anaerobic nitric oxide reductase transcription regulator
Protein accession	YP_001723999
Protein GI	170019045
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3604] Transcriptional regulator containing GAF, AAA-type ATPase, and DNA binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00158351
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000580065
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTTTTT CCGTTGATGT GCTGGCGAAT ATCGCCATCG AATTGCAGCG TGGGATTGGT 
CATCAGGATC GTTTTCAGCG CCTGATCACC ACGCTACGTC AGGTGCTGGA GTGCGATGCG 
TCTGCGTTGC TACGTTACGA TTCGCGGCAG TTTATTCCGC TTGCCATCGA CGGTCTGGCA 
AAGGATGTAC TCGGTAGACG CTTTGCGCTG GAAGGGCATC CACGGCTGGA AGCGATTGCC 
CGCGCCGGGG ATGTGGTGCG CTTTCCCGCA GACAGCGAAT TGCCCGATCC CTATGACGGT 
TTGATTCCTG GGCAGGAGAG TCTGAAGGTT CACGCCTGCG TTGGTCTGCC ATTGTTTGCC 
GGGCAAAACC TGATCGGCGC ACTGACGCTC GACGGGATGC AGCCCGATCA GTTCGATGTT 
TTCAGCGACG AAGAGCTACG GCTGATTGCT GCGCTGGCGG CGGGAGCGTT AAGCAATGCG 
TTGCTGATTG AACAACTGGA AAGCCAGAAT ATGATGCCAG GCGATGCCAC GCCGTTTGAA 
GCGGTGAAAC AGACGCAGAT GATTGGCTTG TCCCCTGGCA TGACGCAACT GAAAAAAGAG 
ATTGAGATTG TGGCGGCGTC CGATCTCAAC GTCCTGATCA GCGGTGAGAC GGGAACCGGT 
AAGGAGCTGG TGGCGAAAGC GATTCATGAA GCCTCGCCAC GGGCGGTGAA TCCGCTGGTC 
TATCTCAACT GTGCTGCACT GCCGGAAAGT GTGGCGGAAA GTGAGTTGTT CGGGCATGTG 
AAAGGAGCGT TTACTGGCGC TATCAGTAAC CGCAGCGGGA AGTTTGAAAT GGCGGATAAC 
GGCACTCTGT TTCTGGATGA GATCGGCGAG TTGTCGTTGG CATTGCAGGC CAAGCTGCTG 
AGGGTGTTGC AGTATGGCGA TATTCAGCGC GTTGGCGATG ACCGTAGTTT GCGGGTCGAT 
GTGCGCGTGC TGGCGGCGAC TAACCGCGAC TTACGCGAAG AGGTGCTGGC AGGGCGATTT 
CGCGCTGACT TGTTTCATCG CCTGAGCGTG TTTCCACTTT CGGTGCCGCC GCTGCGTGAG 
CGGGGCGATG ATGTCATTCT GCTGGCGGGG TATTTCTGCG AGCAGTGTCG TTTGCGGCTG 
GGGCTCTCCC GCGTGGTATT AAGTGCCGGA GCGCGAAATT TACTGCAACA CTATCGTTTT 
CCGGGGAACG TGCGCGAACT GGAACATGCT ATTCATCGGG CGGTAGTGCT GGCGAGAGCC 
ACCCGCAACG GCGATGAAGT GATTCTTGAG GCGCAACATT TTGCTTTTCC TGAGGTGACG 
TTGCCGCCGC CAGAAGCGGC GGCGGTGCCC GTTGTTAAGC AAAACCTGCG TGAAGCGACA 
GAAGCGTTCC AGCGTGAAAC TATTCGCCAG GCACTGGCAC AAAATCATCA TAACTGGGCT 
GCCTGCGCGC GGATGCTGGA AACCGACGTC GCCAACCTGC ATCGGCTGGC GAAACGTCTG 
GGAATGAAGG ATTAA

Protein sequence

MSFSVDVLAN IAIELQRGIG HQDRFQRLIT TLRQVLECDA SALLRYDSRQ FIPLAIDGLA 
KDVLGRRFAL EGHPRLEAIA RAGDVVRFPA DSELPDPYDG LIPGQESLKV HACVGLPLFA 
GQNLIGALTL DGMQPDQFDV FSDEELRLIA ALAAGALSNA LLIEQLESQN MMPGDATPFE 
AVKQTQMIGL SPGMTQLKKE IEIVAASDLN VLISGETGTG KELVAKAIHE ASPRAVNPLV 
YLNCAALPES VAESELFGHV KGAFTGAISN RSGKFEMADN GTLFLDEIGE LSLALQAKLL 
RVLQYGDIQR VGDDRSLRVD VRVLAATNRD LREEVLAGRF RADLFHRLSV FPLSVPPLRE 
RGDDVILLAG YFCEQCRLRL GLSRVVLSAG ARNLLQHYRF PGNVRELEHA IHRAVVLARA 
TRNGDEVILE AQHFAFPEVT LPPPEAAAVP VVKQNLREAT EAFQRETIRQ ALAQNHHNWA 
ACARMLETDV ANLHRLAKRL GMKD