Gene EcE24377A_3124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3124
Symbol
ID	5587803
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	3128789
End bp	3130327
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	51%
IMG OID	640926766
Product	hypothetical protein
Protein accession	YP_001464139
Protein GI	157155143
COG category	[S] Function unknown
COG ID	[COG3517] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03355] type VI secretion protein, EvpB/VC_A0108 family

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGTAC AACAAGAACA TGCCACCTCT GAAACTGCAA CACTGACCAC CACTGAGTCC 
GGCGGCGTTT ATCAGTCCCT GTTTGATAAA ATTAATTTAA CCCCGGTGTC TTCCATTCAG 
GAAATAGATT TATGGCAAAA CAGCGAAACA CTGGCGGATG CCTCACCCGA TGAGCGCGTG 
ACAGCGGCGA TTCACGTTCT ACTTTCCTGT CTGGCGAAAT CAGGCGAGAA CGTGGTCAAG 
CTCGACAAGA GCCTGCTGGA TTTTCATATC GACGATTTGG ATCAGAAAAT CAGTAAACAG 
CTTGATGCGG TCATGCACCA TCCTGAATTC CAGAAAGTCG AGTCGCTGTG GCGCGGCACA 
TGGTTCGTCG TACAGCGCAC TGATTTTCGC AAAAATGTCA GAATTGAATT GCTGGATATC 
AGCAAAGAGC ATCTGCGTCA GGATTTCGAC GACTCCCCGG AAATCATTCA GAGCGGTTTA 
TATCGTCATA CATACATTCA GGAGTACGAT ACGCCGGGTG GCGAACCTGT TGCCTCATTA 
ATTTCCAGCT ATGAATTTGA TAACAGCCCG CAGGATATTG CCCTGCTGCG CAATATTTCC 
AGAGTGTCTG CCGCTTCCCA TATGCCTTTT ATCGGTTCTG TCGGGCCGAA ATTCTTCCTT 
AAAAATTCGA TGGAAGAAGT CGCCGCGATT AAAGATATCG GCAACTACTT TGACCGCGCA 
GAATATATTA AATGGAAATC GTTTCGTGAT ACCGATGACA GCCGCTATGT GGGATTAGTG 
ATGCCGCGAG TGCTGGGCCG TCTGCCCTAT GGGCCGGACA CGGTGCCGGT ACGCAGCTTT 
AACTATGTGG AAGAAGTCAA AGGCCCGGAT CACGAAAAGT ATCTCTGGAC AAACGCCTCG 
TTCGCCTTTG CCGCCAATAT GGTGAAGAGC TTTGTGAATA ATGGCTGGTG CGTGCAGATC 
CGTGGTCCAC AAGCAGGTGG CGCAGTGGCC GATCTGCCCA TCCATCTTTA CGATCTCGGC 
ACCGGCAATC AGGTCAAAAT TCCGTCCGAA GTGATGATCC CGGAAACCCG CGAATTTGAA 
TTTTCCAACC TTGGCTTTAT TCCGCTCTCT TATTATAAGA ATCGCGATTA CGCCTGCTTC 
TTCTCGGCAA ACTCTGCCCA GAAACCGGCG TTGTATGATA CCGCTGACGC CACCGCCAAC 
AGCCGTATTA ACGCCCGTCT GCCCTATATC TTCCTGCTGT CCCGCATTGC GCATTACCTG 
AAAATCATCC AGCGCGAGAA TATCGGTACC ACCAAAGACC GCCGCGTACT GGAACTGGAA 
CTGAACACCT GGATCCGCAC ACTGGTGACG GAGATGACCG ATCCGGGTGA TGAACTGCAG 
GCGTCTCACC CGCTGCGCGA CGGTAAGGTT ATCGTGGAAG ATATTGAGGA CAATCCGGGC 
TTCTTCCGCG TCAGACTCTT TGCCGTGCCG CATTTCCAGA TTGAAGGGAT GGATATCAAC 
CTGTCACTGG TTTCCCAGAT GCCGAAAGCG AAAGCCTGA

Protein sequence

MSVQQEHATS ETATLTTTES GGVYQSLFDK INLTPVSSIQ EIDLWQNSET LADASPDERV 
TAAIHVLLSC LAKSGENVVK LDKSLLDFHI DDLDQKISKQ LDAVMHHPEF QKVESLWRGT 
WFVVQRTDFR KNVRIELLDI SKEHLRQDFD DSPEIIQSGL YRHTYIQEYD TPGGEPVASL 
ISSYEFDNSP QDIALLRNIS RVSAASHMPF IGSVGPKFFL KNSMEEVAAI KDIGNYFDRA 
EYIKWKSFRD TDDSRYVGLV MPRVLGRLPY GPDTVPVRSF NYVEEVKGPD HEKYLWTNAS 
FAFAANMVKS FVNNGWCVQI RGPQAGGAVA DLPIHLYDLG TGNQVKIPSE VMIPETREFE 
FSNLGFIPLS YYKNRDYACF FSANSAQKPA LYDTADATAN SRINARLPYI FLLSRIAHYL 
KIIQRENIGT TKDRRVLELE LNTWIRTLVT EMTDPGDELQ ASHPLRDGKV IVEDIEDNPG 
FFRVRLFAVP HFQIEGMDIN LSLVSQMPKA KA