Gene EcDH1_0425 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0425
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	447268
End bp	448557
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	50%
IMG OID
Product	sun protein
Protein accession	ACX38115
Protein GI	260447693
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAC AACGTAATTT ACGTAGCATG GCGGCCCAGG CCGTTGAACA AGTCGTCGAG 
CAAGGGCAAT CATTAAGCAA CATTCTGCCA CCGCTCCAGC AAAAAGTTTC CGATAAAGAC 
AAAGCACTTC TTCAAGAGTT GTGCTTTGGC GTACTGCGTA CGCTTTCGCA GTTAGACTGG 
CTGATTAATA AGTTAATGGC CCGTCCGATG ACCGGCAAAC AGCGGACCGT GCATTACCTG 
ATTATGGTTG GTTTGTATCA ACTGCTTTAT ACCCGCATTC CACCTCATGC TGCGCTGGCT 
GAAACGGTTG AAGGCGCTAT CGCAATTAAG CGTCCGCAAC TTAAAGGGTT GATAAACGGT 
GTATTACGCC AGTTCCAGCG TCAGCAAGAA GAGTTATTAG CCGAGTTTAA TGCCAGTGAT 
GCACGTTATC TGCATCCTTC CTGGTTGCTG AAGCGTCTGC AAAAAGCGTA TCCAGAGCAG 
TGGCAATCCA TCGTCGAAGC CAATAACCAG CGTCCGCCAA TGTGGCTGCG TATTAATCGT 
ACGCATCATT CCCGCGACAG CTGGCTTGCA TTGCTGGATG AAGCAGGAAT GAAAGGTTTC 
CCGCATGCGG ATTACCCTGA TGCTGTACGT CTGGAAACAC CTGCACCTGT TCATGCGCTA 
CCTGGTTTTG AAGACGGATG GGTTACCGTT CAGGATGCAT CAGCACAAGG TTGCATGACC 
TGGCTTGCGC CACAAAACGG TGAACACATT TTGGATCTTT GTGCCGCCCC CGGCGGTAAA 
ACAACGCATA TCCTTGAGGT GGCACCAGAA GCGCAGGTTG TTGCGGTTGA TATCGACGAA 
CAGCGCCTCT CTCGGGTTTA CGACAATTTA AAACGCCTTG GTATGAAGGC GACCGTGAAA 
CAAGGTGATG GCCGTTACCC TTCTCAATGG TGTGGCGAGC AACAGTTTGA TCGCATTTTA 
TTAGATGCGC CTTGTTCAGC AACCGGTGTG ATTCGTCGCC ATCCAGATAT TAAATGGTTA 
CGTCGCGATC GCGATATCCC GGAACTCGCG CAATTGCAGT CTGAAATTCT CGACGCCATT 
TGGCCGCATT TAAAAACCGG TGGAACTCTG GTCTATGCCA CCTGTTCGGT GTTACCGGAA 
GAGAATAGCC TGCAGATTAA AGCCTTTTTG CAACGTACCG CTGATGCCGA ACTTTGCGAA 
ACAGGAACAC CAGAGCAACC GGGTAAACAA AATCTACCTG GTGCCGAAGA GGGCGACGGC 
TTCTTTTACG CTAAGCTAAT CAAAAAGTGA

Protein sequence

MKKQRNLRSM AAQAVEQVVE QGQSLSNILP PLQQKVSDKD KALLQELCFG VLRTLSQLDW 
LINKLMARPM TGKQRTVHYL IMVGLYQLLY TRIPPHAALA ETVEGAIAIK RPQLKGLING 
VLRQFQRQQE ELLAEFNASD ARYLHPSWLL KRLQKAYPEQ WQSIVEANNQ RPPMWLRINR 
THHSRDSWLA LLDEAGMKGF PHADYPDAVR LETPAPVHAL PGFEDGWVTV QDASAQGCMT 
WLAPQNGEHI LDLCAAPGGK TTHILEVAPE AQVVAVDIDE QRLSRVYDNL KRLGMKATVK 
QGDGRYPSQW CGEQQFDRIL LDAPCSATGV IRRHPDIKWL RRDRDIPELA QLQSEILDAI 
WPHLKTGGTL VYATCSVLPE ENSLQIKAFL QRTADAELCE TGTPEQPGKQ NLPGAEEGDG 
FFYAKLIKK