Gene EcolC_1607 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1607
Symbol
ID	6066178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1787581
End bp	1788684
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	31%
IMG OID	641601023
Product	hypothetical protein
Protein accession	YP_001724593
Protein GI	170019639
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.634641
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAAAT TAAAAACTAA ATCAAGTAAT TGCGGAATTA TAACATTCCA TAAAGCACAT 
AATTATGGAG CTGTTTTACA GGCATATGCG TTAATGACAA CATTAAAAAA AAATGGATTA 
CAAGTTAGTT TTATAGATTA TGAGAATGAA GTGCTTTCAA GGGGGTATAG CTTTTATCCT 
ATATTAAAGG GAACGTCGAC TATAAATTAT ATTAAGGAAT GGATTCATTT GATTTTAGAC 
TTAAAACGTA AATATAAAAG GTTTAAAGCA TTTAGTGATT TTATAAATAA ATATATTGTA 
TGTACGCCAT TGAATAAAGA CACTAAATGT TTCGATATTA TCTTTCTTGG TAGTGATCAG 
ATATGGAATG CAAATTATAC TAACGGAGTA GACCCTAACT ATTATGGACA AGGACCTTAT 
TGTAAAGCGC ACAAATTAGT TTCTTATGCG GCAAGTATGG GTAAGCTGTG TTTGGGAAAA 
TATGAGGAAC AAGCATTCTT ATCTTTGATA AATAATATAC AGCAGATTGG TGTTAGAGAA 
AATTATTTAA AGACGTACAT AGAAGAAAAA ACCGATTTAA AATGTGATGT TAATCTTGAT 
CCGACTCTTC TGCTTACTAA AAGCGATTGG GATAAACTGG CAGCACCTAA CGATACACAA 
GAACGCTATC TTCTTATATA TGAAATGCAT ACTCACAGGA GTACGGATAT TATTGCTAAT 
AAAATAGCAA AAATACTAAA TTTAAAGATT AAAAAATTAG CATGTCGAAC AAATTACAAA 
ATTGAGAAGG ATGTAATAAC AAATGCAGGA CCACAAAATT TCTTAACTTT ATTCAAAAAT 
GCAGCTTTCG TGGTGACCAC TTCTTTTCAC GGAACTGTAT TCTCAATTAT AAATCAGGTG 
CCATTTTTTA CTTTGGAATT TGGTAACGAG ATAGACTTAA GAAGCCGTTC ACTTCTTGAA 
ATGCTTAATT TGAATGAACG AATGATCAGT GACGATGCAA ATTTGAATTA TGAGAAGCTT 
TTCTTGGAAT TTGATGAGGC TCATTCAATA TTAGAAAGTA AAAGGCAGGA TTCTTTAAGT 
TTCATTGAGA GAGCTCTGAG TTAA

Protein sequence

MAKLKTKSSN CGIITFHKAH NYGAVLQAYA LMTTLKKNGL QVSFIDYENE VLSRGYSFYP 
ILKGTSTINY IKEWIHLILD LKRKYKRFKA FSDFINKYIV CTPLNKDTKC FDIIFLGSDQ 
IWNANYTNGV DPNYYGQGPY CKAHKLVSYA ASMGKLCLGK YEEQAFLSLI NNIQQIGVRE 
NYLKTYIEEK TDLKCDVNLD PTLLLTKSDW DKLAAPNDTQ ERYLLIYEMH THRSTDIIAN 
KIAKILNLKI KKLACRTNYK IEKDVITNAG PQNFLTLFKN AAFVVTTSFH GTVFSIINQV 
PFFTLEFGNE IDLRSRSLLE MLNLNERMIS DDANLNYEKL FLEFDEAHSI LESKRQDSLS 
FIERALS