Gene EcolC_2403 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2403
Symbol
ID	6068594
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2650429
End bp	2651859
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	50%
IMG OID	641601812
Product	hypothetical protein
Protein accession	YP_001725364
Protein GI	170020410
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000223756
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGTTTTTC ATTTTTTACC GGAAGTTACC GACGTTTTGA GCCGTTTCGT TCCTCGCATT 
ATTTCGTTTT ATTTACTCTT GCTGGCGGCA GGCGGTACAG CTAACGCACA ATCTACCTTC 
GAGCAAAAAG CGGCAAATCC CTTTGATAAT AACAATGATG GTCTGCCGGA TTTAGGCATG 
GCACCTGAAA ATCATGATGG GGAAAAACAC TTTGCTGAAA TTGTGAAAGA TTTCGGCGAA 
ACCAGTATGA ATGATAACGG GCTGGATACT GGCGAGCAGG CAAAAGCTTT CGCATTGGGA 
AAAGTCCGCG ACGCGCTTAG TCAACAGGTT AATCAGCACG TAGAGTCCTG GCTATCACCG 
TGGGGAAATG CCAGTGTTGA TGTCAAAGTG GATAACGAAG GTCATTTTAC CGGCAGTCGT 
GGAAGCTGGT TTGTGCCGTT ACAAGATAAT GATCGTTATC TCACCTGGAG CCAGCTTGGT 
CTTACTCAGC AGGATGATGG GTTGGTGAGC AATGTGGGCG TTGGGCAACG CTGGGCGCGC 
GGCAACTGGC TGGTGGGTTA TAACACTTTT TATGACAACT TGCTGGACGA AAATCTTCAG 
CGAGCGGGCT TTGGTGCCGA AGCGTGGGGC GAATATTTGC GACTATCGGC AAACTTTTAT 
CAGCCATTTG CTGCATGGCA TGAACAGACA GCCACGCAGG AACAACGGAT GGCGCGCGGG 
TACGACCTGA CAGCCCGGAT GCGCATGCCG TTCTATCAAC ACCTCAATAC CAGTGTCAGC 
GTAGAACAGT ATTTTGGTGA TCGTGTTGAT TTGTTTAACT CTGGTACGGG TTATCACAAT 
CCCGTCGCGT TGAGTCTGGG ATTAAATTAC ACCCCTGTGC CATTAGTCAC TGTGACGGCC 
CAGCATAAAC AGGGTGAAAG TGGCGAGAAT CAAAATAACC TCGGGCTGAA TCTTAATTAC 
CGCTTTGGTG TACCGCTCAA AAAACAACTT TCTGCGGGCG AGGTTGCCGA AAGTCAGTCG 
TTACGTGGTA GTCGCTATGA TAATCCGCAG CGAAATAATC TACCGACTCT TGAGTACCGA 
CAGCGAAAAA CGTTAACGGT GTTTCTGGCG ACACCGCCGT GGGATCTAAA ACCTGGCGAA 
ACAGTGCCGC TGAAATTACA AATCCGCAGT CGTTACGGTA TTCGGCAACT GATTTGGCAG 
GGCGATACGC AGATATTAAG TTTGACGCCA GGCGCACAAG CCAACAGCGC GGAGGGCTGG 
ACGCTGATCA TGCCTGACTG GCAGAACGGG GAAGGGGCGA GCAATCACTG GCGATTGTCG 
GTGGTGGTGG AAGATAACCA GGGGCAGCGT GTCTCCTCCA ATGAGATCAC GCTAACGCTT 
GTCGAACCGT TCGACGCATT GTCAAACGAC GAACTGCGCT GGGAACCGTA A

Protein sequence

MVFHFLPEVT DVLSRFVPRI ISFYLLLLAA GGTANAQSTF EQKAANPFDN NNDGLPDLGM 
APENHDGEKH FAEIVKDFGE TSMNDNGLDT GEQAKAFALG KVRDALSQQV NQHVESWLSP 
WGNASVDVKV DNEGHFTGSR GSWFVPLQDN DRYLTWSQLG LTQQDDGLVS NVGVGQRWAR 
GNWLVGYNTF YDNLLDENLQ RAGFGAEAWG EYLRLSANFY QPFAAWHEQT ATQEQRMARG 
YDLTARMRMP FYQHLNTSVS VEQYFGDRVD LFNSGTGYHN PVALSLGLNY TPVPLVTVTA 
QHKQGESGEN QNNLGLNLNY RFGVPLKKQL SAGEVAESQS LRGSRYDNPQ RNNLPTLEYR 
QRKTLTVFLA TPPWDLKPGE TVPLKLQIRS RYGIRQLIWQ GDTQILSLTP GAQANSAEGW 
TLIMPDWQNG EGASNHWRLS VVVEDNQGQR VSSNEITLTL VEPFDALSND ELRWEP