Gene VC0395_1041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_1041
Symbol
ID	5134492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009456
Strand	-
Start bp	1020380
End bp	1022197
Gene Length	1818 bp
Protein Length	605 aa
Translation table	11
GC content	50%
IMG OID	640531363
Product	phage tail tape measure family protein
Protein accession	YP_001215877
Protein GI	147672374
COG category
COG ID
TIGRFAM ID	[TIGR01760] phage tail tape measure protein, TP901 family, core region

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGAAA AGCTGATGAT GGTGATTGGT CTAGTTGACC AAATCACCAA GCCACTGCAA 
GGCATCACCA CCGAAATTAA TGGAGCCATG AGTGCCGCTG AAAAAGGCAT GGAACAGGCT 
GCAAAGGGTG GTGCTGGCTT GTGGGCGACA GGCGTTGCCA TTCAAAATGC GTTGATGCCC 
GCCATTGAAA TTAACCGCAA GATTGGTGAA GTAAAATCAC TCAATGTCGC GGCGGATACC 
CTAGAACACC TGAAAAATAC AGCGCTGGAT TTTTCAGGCG AATACGGTAA GTCAGCCACT 
GAATTTATCG GGGCGGCTTA CGATATTCAA TCTGCTATCG CAGGGTTAAA AGGCACTGAG 
CTTTCAGATT TTACCAAAAG CTCGGGCATT CTTGCGGCGG CGACCAAAGC AGACACCGCA 
ACCATTACCA ACTACATGGG CACCATGTAT GGCATTTTTG AAAAAGATGC CGCAGCACTC 
GGAAACTCAA ACTGGGTAGA ACGTGTGACA GGCATGACCG CACAAGCGGT GCAGATGTTT 
AAAACCGATG GTAATAAAAT GTCTCAGGCG TTCAGTTCGC TTGGTTCATC AGCAACCGCC 
ATGGGTGTGG ATATGGCCGA GCAAATGGCC GTGCTTGGTA TGCTCTCCGC CACCATGGGT 
GGAGGCGAAG CCGCCACGAA ATACACCGCC TTCCTTGGCG GCGCAGTAAA AGCACAAGAA 
AAACTCGGGC TATCTTTCTT CGACTCATAC GGAAAAATGC TACCGATGGC CGATATGTTG 
GAGTCAATTC AACAGCGTAT TGGGCATTTC TCGACAGATG AACAATTTGC CATTCTCTCT 
GATGCATTCG GTTCGGGTGA GGCGGTAAAA CTTATTCAAA ACCTGCAAAG CAAAACTGAT 
GAGCTCGCTC AGAAAGTGGT TGAGCTAGAT AAAAACTCAA CCATGGAAAC CGCCATCACT 
ATGGCGAAAG CGATGACAGA TCAATCGCAG CGTTTAGAAA ACTCATGGTT CGCTATTCGA 
ACCGCAGCAT TTGGAATGGT TTTACCAGCC TTCAATGCCG TAACAGGCAG CATCGCCGAT 
GGCCTAATGT GGCTCACATC CATGACTAAA GAGTATCCCA CATTAACCAC TGCACTGAGT 
ACTGTTTCGA TCATCGCTTT ATCTTTTGGC GGTGTGGTTG CCTCTCTCTC GCTCGTGATG 
GGAATAGCCA AAATGATGGC AGGAGGTTGG AAAGTGACCA TGCTTGGGCT AACCGGAATA 
TTAAAGCTGT TTAGAATATT AACTTTGGAT GCTGCAACGG GAACGTGGGT ATTCAACTCA 
GCATTGTGGG CAAACCCGAT AACATGGGTG GTTGCTGGCA TTTTGGCGTT AATCGCTGCA 
GTCGGCGCAA TGATTTACTG GTGGGACGAA ATCAAAGCCT CTTTTGCGGA TACCACTTGG 
TTCAAAATCA TCGCAGCCGC CATAGATGGC GTGATTGAAA TGCTCAACAT GATCCCCGGC 
ATCAACATCG AGTGGCGTGC CGGAGAACTG CCCGATGTGC CAGTACCAGA AACCCAACCC 
GCCATCGCAA AAGCCGTTCC TGTACTGCCA GATGTCGCGG CGCTTGAAGC CTCGCGCCCA 
AGCATGGATA GCACACTCAT TGACTACAAA CGGCCAGAGA ACACCCCGCA GCTATCCAAA 
AACATGGTGA ACAACCTCAA CAGCAGCGAA AGCCGCACAA CCCATAACGT GCGCCAGTAC 
GGTGATGTTT ACATCACGCC ACAAGGCGGC ATGACGCCAG AACAGCTTGC AGAATGGGAT 
GAACTCAATG CCGGATAA

Protein sequence

MDEKLMMVIG LVDQITKPLQ GITTEINGAM SAAEKGMEQA AKGGAGLWAT GVAIQNALMP 
AIEINRKIGE VKSLNVAADT LEHLKNTALD FSGEYGKSAT EFIGAAYDIQ SAIAGLKGTE 
LSDFTKSSGI LAAATKADTA TITNYMGTMY GIFEKDAAAL GNSNWVERVT GMTAQAVQMF 
KTDGNKMSQA FSSLGSSATA MGVDMAEQMA VLGMLSATMG GGEAATKYTA FLGGAVKAQE 
KLGLSFFDSY GKMLPMADML ESIQQRIGHF STDEQFAILS DAFGSGEAVK LIQNLQSKTD 
ELAQKVVELD KNSTMETAIT MAKAMTDQSQ RLENSWFAIR TAAFGMVLPA FNAVTGSIAD 
GLMWLTSMTK EYPTLTTALS TVSIIALSFG GVVASLSLVM GIAKMMAGGW KVTMLGLTGI 
LKLFRILTLD AATGTWVFNS ALWANPITWV VAGILALIAA VGAMIYWWDE IKASFADTTW 
FKIIAAAIDG VIEMLNMIPG INIEWRAGEL PDVPVPETQP AIAKAVPVLP DVAALEASRP 
SMDSTLIDYK RPENTPQLSK NMVNNLNSSE SRTTHNVRQY GDVYITPQGG MTPEQLAEWD 
ELNAG