Gene VC0395_A2475 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A2475
Symbol	sun
ID	5136947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	+
Start bp	2626026
End bp	2627330
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	54%
IMG OID	640533926
Product	sun protein
Protein accession	YP_001218368
Protein GI	147675284
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00563] ribosomal RNA small subunit methyltransferase RsmB

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCTTTTT GTTTAGGTTT TATTATGAAT GTTCGCGCCG CTGCTGCGTC GGCTCTTTAC 
CAAGTGGTTG ATTTAGGGCA CTCACTGTCC AATGCTTTGC CTGCGGCTCA GCAGCAAATT 
CGCCCACGTG ATCACGCCCT GCTGCAAGAG ATCTGCTATG GCGTTTTGCG CCAATTGCCG 
CGTTTGGAAT CCATCAGCCA AGCTCTGATG GGAAAACCGT TGAAAGGCAA ACAACGCGTA 
TTCCACTTCC TGATCCTCGT CGGCTTATAC CAACTGAGCT TTATGCGCAT TCCCGCACAT 
GCTGCGGTAG GGGAAACCGT CGAAGGCGCG CAAGATTTGA AAGGCCCTCG TCTGCGCGGC 
TTGATCAATG CGGTGCTGCG TAACTATCAG CGTGACCAAG AAGGCTTAGA TGCTCAAGCC 
ACCAGCCATG ACGCAGGGCG CTACGGCCAT CCGGGCTGGT TATTGAAATT GCTCAAAGAG 
AGCTACCCAG AGCAGTGGCA ACAAATTGTT GAAGCCAACA ACAGCAAAGC GCCGATGTGG 
CTACGCGTCA ATCATCAACA CCATACTCGT GCTGAGTATC AAGCCCTGCT CGAACAAGCT 
GGCATCGTCA CTACGCCTCA TGCGCAAGCC GAAGATGCGC TGTGCTTAGA AACGCCTTGC 
GATGTACACC AACTGCCGGG TTTCGCTGAA GGTTGGGTTT CAGTACAAGA TGCCGCTGCG 
CAGTTAGCAC TGACTTACCT TGCACCGCAA GCAGGAGAGC TGATTTTAGA TTGCTGCGCT 
GCCCCTGGTG GCAAAACTGC GCACATCTTG GAGCGCACAC CAGAGAGCCA AGTCGTTGCG 
ATTGATTGTG ATGAAACTCG CCTCAAACGC GTGCGAGAAA ACCTGCAGCG TTTAGAGCTC 
ACTGCGCAAG TGATTTGTGG CGATGCGCGT TACCCGCAAC AGTGGTGGCA AGGCGAACAG 
TTTGATCGCA TCTTGCTGGA TGCACCTTGC TCGGCGACCG GCGTGATTCG CCGCCATCCC 
GACATCAAAT GGCTGCGCCG CGCAGACGAT ATCGCGGCAT TAGCCGAGCT ACAGCGCGAA 
ATTTTGGATG CGATGTGGCA ACAACTCAAA CCCGGTGGTA GTTTGGTGTA CGCAACGTGC 
TCGATCACAC CACAAGAAAA CCGCCTACAG GTCAAAGCGT TCCTTGAACG CACGCCAGAT 
GCGCGCTTAG TGGGTTCCGA TCCCGCGCAG CCCGGCCGCC AAATCCTTCC CGGAGAGGAA 
GCGATGGACG GTTTCTATTA CGCCGTATTA AGCAAACAAC ACTGA

Protein sequence

MAFCLGFIMN VRAAAASALY QVVDLGHSLS NALPAAQQQI RPRDHALLQE ICYGVLRQLP 
RLESISQALM GKPLKGKQRV FHFLILVGLY QLSFMRIPAH AAVGETVEGA QDLKGPRLRG 
LINAVLRNYQ RDQEGLDAQA TSHDAGRYGH PGWLLKLLKE SYPEQWQQIV EANNSKAPMW 
LRVNHQHHTR AEYQALLEQA GIVTTPHAQA EDALCLETPC DVHQLPGFAE GWVSVQDAAA 
QLALTYLAPQ AGELILDCCA APGGKTAHIL ERTPESQVVA IDCDETRLKR VRENLQRLEL 
TAQVICGDAR YPQQWWQGEQ FDRILLDAPC SATGVIRRHP DIKWLRRADD IAALAELQRE 
ILDAMWQQLK PGGSLVYATC SITPQENRLQ VKAFLERTPD ARLVGSDPAQ PGRQILPGEE 
AMDGFYYAVL SKQH