Gene VC0395_A2686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A2686
Symbol
ID	5136148
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	2842289
End bp	2843284
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	50%
IMG OID	640534134
Product	NifR3/Smm1 family protein
Protein accession	YP_001218564
Protein GI	147675018
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000000024991
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCTGGTAC GAAGCTGTGA AGACGTTTTG AAAATCGGAA ATCATCAACT TAAGAACAAT 
CTGATCGTCG CCCCGATGGC GGGTGTCACC GACAGACCCT TTCGAGAGTT GTGTTTACGC 
TACGGGGCAG GAATGGCGGT CAGTGAAATG ATGTCATGCA ATCCTGCGTT GTGGAAAACG 
GCCAAATCGC AAAACCGCAT GGTACATGAA GGCGAATCGG GCATTCGCTC AGTACAAATT 
GCGGGCAGCG ATCCACAGCT GATGGCCGAA GCAGCGCAGT TCAGCGTTGA AAACGGTGCG 
CAAATCATCG ATATCAACAT GGGCTGCCCA GCCAAAAAAG TAAATAAAAA GCTCGCGGGC 
TCTGCACTGC TGCGCTATCC GGATGTGATT GAAGACATCT TGAAAGCGGT AGTGAATGCA 
GTGAATGTGC CAGTCACACT CAAAACCCGA ACGGGTTGGG ATACAGACAA TAAAAACTGT 
CTCTCGATTG CTCAATTAGC CGAAGACTGC GGCATACAAG CACTGGCTCT CCATGGACGA 
ACTCGTGCCT GCATGTACAA AGGTGAGGCG GAATACGACA GCATTAAAGC GGTCAAAGCG 
GCTGTGAGCA TTCCGGTTAT CGCTAACGGT GATATCGATA GCCCGGAGAA AGCACGCTAC 
GTACTGGAGT ACACCGGTGC AGACGCTTTA ATGATTGGCC GTCCTGCCCA AGGACGACCA 
TGGATTTTTC AGGAAATCCA ACACTTTTTG GAACACGGCA CCACAATGCC AGAACTTCCA 
ATTTCGGAAG TGAAAGACAT CATGCTTGGT CATGTAACCG CACTCCATCA GTTTTATGGA 
GAGTACTTAG GCCCACGAAT TGCGCGCAAA CACGTGAGTT GGTACCTGCA AGAGCATGAA 
CAAGCGAGTG CGTTTCGCCG TACCTTCAAC GCCATTGAGA CTGCTGACCA GCAACTCGAT 
GCGCTCGAAG GGTATTTTGA TAACGTTGCA TCATAA

Protein sequence

MLVRSCEDVL KIGNHQLKNN LIVAPMAGVT DRPFRELCLR YGAGMAVSEM MSCNPALWKT 
AKSQNRMVHE GESGIRSVQI AGSDPQLMAE AAQFSVENGA QIIDINMGCP AKKVNKKLAG 
SALLRYPDVI EDILKAVVNA VNVPVTLKTR TGWDTDNKNC LSIAQLAEDC GIQALALHGR 
TRACMYKGEA EYDSIKAVKA AVSIPVIANG DIDSPEKARY VLEYTGADAL MIGRPAQGRP 
WIFQEIQHFL EHGTTMPELP ISEVKDIMLG HVTALHQFYG EYLGPRIARK HVSWYLQEHE 
QASAFRRTFN AIETADQQLD ALEGYFDNVA S