Gene Dvul_3047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_3047
Symbol
ID	4661976
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008741
Strand	-
Start bp	125404
End bp	126723
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	70%
IMG OID	639813967
Product	hypothetical protein
Protein accession	YP_961246
Protein GI	120586901
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0458] Carbamoylphosphate synthase large subunit (split gene in MJ)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.836021
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGTCG TCCTCGTCCT CGGTGCCGAG ACCATGCTGG CGCGCGTGGT CAGCCGCAGC 
CTGCATCGCG CGGGTTTCAC CGTGCTGGCG GCCTCCTCCA CGCCGTGGCC CATCTGCGCC 
TATTCGCGCT ATGTGCGGCG CACCTTCACC CACGCCGACC CGAAGCACGA CGAGTCGCGG 
TTCATCGACG ACATCCGCCG CATCTGCGAG ACGCAGGGCG TGGACGTGCT GTTGCCCATC 
CTGCGCGAGT GCGCCGTCAT CGCACGGCAT CGCCACCTCT TCGGCCCCGG CGTGCGGATG 
CTGCTTGGCG ACGCCGCGAC GCTGGCCGAC TTCGGCGACA AGTACCGTAC CTACGAGGTG 
GCGCGCGACG CGGGGCTTGC CGTGCCCGAG TACCGCAGGG CTGCCGACCT CGCTGCCGAC 
CCGGCGGCCC TTGCGGCCTT TCCGTGCCCG TGCCTCGCCA AGCCCGTGTG GGGGTGGGGC 
GGCTACGGGA TGTACGAATG CGCCAGCCCG CAGGAGGTCG CCGCCCGCAT CACGGCCATG 
ACCGACCGAC AACGCGAAGA CTACTTCATG CAACAGCGGA TGCCGGGTGA CGTGGTGTGC 
GTGGCCATGC TGTGCGAGGC GGGGCAGATG CACGCGTGCG ACACCTTCCG CATCGTGGCC 
TCGTACCCGA GGCGGCACGG GCAGTCGACA CTGCGCGAGT CGGTGCGGGC CGACGCCGCC 
GTGGACGCGC TGCGGACGCT GCTTGCCCAT GTGGGCTGGA CGGGCCCGTG TCAGGCCGAC 
TTCATCATCG ACCCGGTCAC GGGCACGCCG TACCTCATCG ACATCAACGC CCGGTACTGG 
AATTCGCTGA TTCAGAGCAC CGCCCGCGGG GTGGACTTTC CCGTCATGCA CTGCCGGATG 
GCGCTGGGCA TGGGTGATGC GGGCGGCGCA GGCGGCGCGG GAGATGTTCC GGGCACCGGC 
GCGGCTGGCG TGTCGCCAAG TGTTCCGCCG GGTGTGCCCC CGAGTGTGCC GCCGGGTGTG 
CCGGAAGGCG CGCCGGGCAT GAGTGCAGGC ATGTGCGCGG ACAAGGACAC GGGGGTGAGC 
ACGGCATGGT TCAGTCGCGC CCTGCGCGGC GACCCGGCCC TGCTGCTGCG GCGTCTCTTC 
TCGCGCCCGC AGGGTCAGGC CGCACGGGGC ATCGCCGCCT TCGACGACTG GGACGTCCGC 
GACCCGCTGC CCTTCTTCGC ATGGCCCCTG CGGCATCTGC TTGGGCGCAT CGCCTCGCGG 
GTGGCCCCGC ATCACTACGC AACCGATGGA ACAGGACGAG GTGAAGCATG TCGCTCATGA

Protein sequence

MSVVLVLGAE TMLARVVSRS LHRAGFTVLA ASSTPWPICA YSRYVRRTFT HADPKHDESR 
FIDDIRRICE TQGVDVLLPI LRECAVIARH RHLFGPGVRM LLGDAATLAD FGDKYRTYEV 
ARDAGLAVPE YRRAADLAAD PAALAAFPCP CLAKPVWGWG GYGMYECASP QEVAARITAM 
TDRQREDYFM QQRMPGDVVC VAMLCEAGQM HACDTFRIVA SYPRRHGQST LRESVRADAA 
VDALRTLLAH VGWTGPCQAD FIIDPVTGTP YLIDINARYW NSLIQSTARG VDFPVMHCRM 
ALGMGDAGGA GGAGDVPGTG AAGVSPSVPP GVPPSVPPGV PEGAPGMSAG MCADKDTGVS 
TAWFSRALRG DPALLLRRLF SRPQGQAARG IAAFDDWDVR DPLPFFAWPL RHLLGRIASR 
VAPHHYATDG TGRGEACRS