Gene EcE24377A_0587 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0587
Symbol
ID	5586910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	614342
End bp	616243
Gene Length	1902 bp
Protein Length	633 aa
Translation table	11
GC content	57%
IMG OID	640924305
Product	type VI secretion system Vgr family protein
Protein accession	YP_001461731
Protein GI	157155367
COG category	[S] Function unknown
COG ID	[COG3501] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR01646] Rhs element Vgr protein [TIGR03361] type VI secretion system Vgr family protein

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAACCG GATTACGTTT CACACTGGAA GTGGACGGCC TGCCGCCGGA TGCTTTTGCG 
GTGGTTTCCT TTCATCTGAA CCAGTCACTC TCTTCGCTCT TTTCCCTCGA TCTCTCCCTG 
GTCAGCCAGC AGTTTCTCTC CCTTGAATTT GCGCAGGTGC TGGACAAAAT GGCCTACCTG 
ACGATATGGC AGGGCGATGA AGTACAGCGC CGGGTGAAAG GCGTGGTGAC CTGGTTTGAA 
CTCGGGGAGA ACGACAAAAA CCAGATGCTG TACAGCATGA AGGTGCACCC GCCGCTGTGG 
CGTGCCGGTC TGCGCCAGAA CTTCCGTATC TTCCAGAACG AGGACATCAA AAGCATCCTC 
GGCACGATGT TGCAGGAAAA CGGGGTGACC GAATGGAGTC CGCTGTTCAG CGAGCCGCAT 
CCTTCCCGTG AGTTTTGTGT CCAGTACGGT GAGACTGATT ACGATTTCCT GTGCCGGATG 
GCGGCGGAGG AAGGCATCTT CTTTTATGAG GAGCATGCTT ACAAAAGTAC CGACCAGAGC 
CTGGTGCTGT GCGACACAGT CCGCCATCTG CCCGAATCTT TTGAAATCCC ATGGAACCCG 
AACACCCGTA CCGAGGTGAG CACCCTCTGC ATCAGCCAGT TCCGCTACAG CGCACAAATC 
CGCCCTTCTT CCGTGGTGAC CAAGGACTAC ACCTTTAAAC GACCCGGCTG GCCAGGGCGT 
TTTGATCAGG AAGGCCAGTA CCAGGATTAC CAGCGCACGC AGTATGAAGT GTATGACTAC 
CCCGGACGTT TCAAGGGTGC CCACGGGCAG AACTTTGCCC GCTGGCAGAT GGACGGCTGG 
CGAAACAACG CAGAAGTGGC GCGCGGAACA AGCCGTTCGC CGGAGATATG GCCGGGACGG 
CGAATTGTGC TGACGGGGCA TCCGCAGGCA AACCTGAACC GGGAATGGCA GGTGGTGGCA 
AGTGAACTGC ACGGCGAACA GCCACAGGCG GTGCCAGGAC GGCAGGGAGC GGGGACGGCG 
CTGGAGAACC ATTTTGCGGT GATCCCGGCA GACAGAACAT GGCGACCACA GCCGTTGCTG 
AAACCGCTGG TCGACGGCCC GCAGAGCGCT GTCGTGACAG GACCGGCAGG CGAGGAAATC 
TTCTGCGACG AACATGGTCG CGTGCGGGTG AAGTTCAACT GGGACCGTTA TAACCCGGCA 
GACCAAGACA GTTCGTGCTG GATCCGTGTG GCACAGGCGT GGGCAGGCAC CGGTTTTGGC 
CACCTGGCGA TACCGCGTGT GGGTCAGGAG GTGATTGTAG ACTTCCTCAA CGGCGATCCG 
GACCAGCCGA TCATTATGGG GCGCACCTAC CACCAGGAAA ACCGCACCCC CGGCAGCCTG 
CCGGGAACAA AGACGCAGAT GACCATCCGC TCCAAAACGT ACATGGGCAG CGGATTTAAT 
GAGCTGAAGT TTGATGATGC GACAGGGAGA GAACAGGTCT ACATCCACGC GCAGAAGAAC 
ATGGATACCG AAGTGCTCAA CGACCGTACC ACCACCGTAA AACACGATCA CCGCGAAACC 
GTAAAAAATG ACCAGACGGT CACGATCCAG GAAGGTAACC GCCTTCTTAC GGTGGAAAAA 
GGCCACAAGA TCACCGGAGT ACTGAAAGGG TCTTTATCTG AGGATGTCTT TCAGGACAGA 
GGCACGATTG CCGGTTCGGT GCATGTTGAC GCTGTAAACA ATGGTGGCGA AGGCGACGGT 
ATACAGGCTT ATACGGCGAT TAAGGAAATT TTGCTGGCCG TGGAGGAAAG CAAAATTGCG 
CTGACGCCGG ATGGCATTCA GCTACAGGTC GGGGAATCGA CGGTAATCAG GCTGTCGAAG 
GATGGCATCA CCATCGTGGG CGGTTCTGTT TTCATCAACT GA

Protein sequence

MSTGLRFTLE VDGLPPDAFA VVSFHLNQSL SSLFSLDLSL VSQQFLSLEF AQVLDKMAYL 
TIWQGDEVQR RVKGVVTWFE LGENDKNQML YSMKVHPPLW RAGLRQNFRI FQNEDIKSIL 
GTMLQENGVT EWSPLFSEPH PSREFCVQYG ETDYDFLCRM AAEEGIFFYE EHAYKSTDQS 
LVLCDTVRHL PESFEIPWNP NTRTEVSTLC ISQFRYSAQI RPSSVVTKDY TFKRPGWPGR 
FDQEGQYQDY QRTQYEVYDY PGRFKGAHGQ NFARWQMDGW RNNAEVARGT SRSPEIWPGR 
RIVLTGHPQA NLNREWQVVA SELHGEQPQA VPGRQGAGTA LENHFAVIPA DRTWRPQPLL 
KPLVDGPQSA VVTGPAGEEI FCDEHGRVRV KFNWDRYNPA DQDSSCWIRV AQAWAGTGFG 
HLAIPRVGQE VIVDFLNGDP DQPIIMGRTY HQENRTPGSL PGTKTQMTIR SKTYMGSGFN 
ELKFDDATGR EQVYIHAQKN MDTEVLNDRT TTVKHDHRET VKNDQTVTIQ EGNRLLTVEK 
GHKITGVLKG SLSEDVFQDR GTIAGSVHVD AVNNGGEGDG IQAYTAIKEI LLAVEESKIA 
LTPDGIQLQV GESTVIRLSK DGITIVGGSV FIN