Gene Daro_3609 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3609
Symbol
ID	3568273
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3876590
End bp	3878314
Gene Length	1725 bp
Protein Length	574 aa
Translation table	11
GC content	65%
IMG OID	637682082
Product	Rhs element Vgr protein
Protein accession	YP_286808
Protein GI	71909221
COG category	[S] Function unknown
COG ID	[COG3501] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR01646] Rhs element Vgr protein

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.0000128418
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCCGGAAA CCCGCGCCCT GCCCATCGCT GCCGAACATC GCGAATTCAC CGTCAAGGCC 
GGTGGCCAGG CGGTGCCGCG CGAGCATCAG CTGCTCTCGG TCAGCGTCAC GGTCGCGGCC 
AACCGCATAG CCTCGGCCCG GCTGGTCTAT GTCGATGGCG CCGCGTCGAC CGGGCAGTTT 
CCGCTCAGCG ACGGTGACCT GTTCACGCCG GGGCAAAGCA TCGAAATCCT GGCCGGCGCC 
GGGCGCGACA GCACCTCGGT GTTCATCGGC ACGGTCGTTC GCCAGGGCGC CCGGGTGCGG 
GAAGCAGCCG CCTCGCAACT GGTCGTCGAT TGCAGGCACG CGGCAATGAA ACTGGCCGTC 
ACCGAGCGGT CGACCGACCA TTTCGATAAA ACCGACAGCG ACATCATCGA AGCCGTGCTC 
GGCGCGGCCG GTGTCGGCAC CGATGTCGAA GCGACCACGC TGCAACACAA GCAGGTCTTG 
CAGTATCAGA GTACGGACTG GGATTTCATC CTTGCCCGGG CACGGGCCAA CGGCCAGCTG 
GTCTGGTGCG AAGGCGACAA GGTAGTGCTC CGCAAACCGG CGCTGACTGG CGCCACGGTG 
TGCACACTGC AGTACGGCGC GACGCTGCTC GAATTCGAAG GCGAAATCGA CGCCCGTCTG 
CAGCACGGTG AATACAAGGG CACGAGCTGG GATGCAGCGA GCCAGGAGGC CGTTGAGGTG 
CAGGCGGCAA TGCCGTCCTT TACGCCACCC GGCAACCTGA GCAGCGACGA CCTGGCCGGC 
GTTGCCGATC AGGCTTTCGA TGTGCGCCAC CCGGGGCTGC CGGAAGCCGA AACGCAGGCC 
TGGGTCGATG GCATCGCGCT GTATCGCCGG GTCGATCAGG TTTCCGGGCG CGGCAAGTGC 
GAGGGCATCG CCACGGTCAA ACCCGGCGTG GTCGTCGAAC TGGCCGGTCT TGGCCGGCGC 
TTCAACGGCA AGGTGCTGGT CACCGGCGTG CGCCATGAAT TCAGTCTGGT GCAGGGCTGG 
AAGACTCATG TGCAGTTCGG AGGCGTCGAT CTTGAGGCGC CCGGAAAGGC CAGGGCCGAC 
GGCCTGCTGC CCGGCGTTTC GGGCCTGCAG ATTGGTGTCG TCACCAGCAA CGAAGACCCG 
GATGGCGAGC ATCGGGTGCG CGTCAAACTG CCGCTCCTCG GGCTGGCCAG CGACGGTCTG 
TGGGCTCGGG TGGCCAGCCT CGATGCCGGC GACGACCGAG GCTTCTTCTT CCGCCCCGAA 
ATTGGCGACG AGGTGACGGT CGGTTTTCTG GCCGACGATC CGCGCCACCC AGTCATCCTC 
GGCATGCTGC ACAGCAGTGC CAAGCCGGCG CCGCTCGAAG GCAGCGACGA CAACCACGAA 
AAGATGCTGA AGACCCGTTC CGGTATGACC GTGCATTTTG ACGACGACAA GATCGTCATG 
ACCTTGGCCA CGCCGGCCGG GAATTCGATT GTGCTCAGCG AGGACGAAAA GTCGCTGACG 
CTGGCCGACC AGAACGGCAA CAAGATGGTC ATGGACAGCG ACGGCATCCA TTTCGAGAGC 
GCCAAGGCGG TCGAAATGAA GGCGGGCACG GAAACCAAGA TGGAAGCGAC GGCCAGCTTC 
GAAATCAAGG CTGGCAGCGA ATTGAAGCTT GAGGGCAGCG CCAGCGCCGA ACTCAAGGGC 
GGCGGCATGG CCAAGTTGTC CGGCGCCATG GTTCAGATCA ACTAG

Protein sequence

MPETRALPIA AEHREFTVKA GGQAVPREHQ LLSVSVTVAA NRIASARLVY VDGAASTGQF 
PLSDGDLFTP GQSIEILAGA GRDSTSVFIG TVVRQGARVR EAAASQLVVD CRHAAMKLAV 
TERSTDHFDK TDSDIIEAVL GAAGVGTDVE ATTLQHKQVL QYQSTDWDFI LARARANGQL 
VWCEGDKVVL RKPALTGATV CTLQYGATLL EFEGEIDARL QHGEYKGTSW DAASQEAVEV 
QAAMPSFTPP GNLSSDDLAG VADQAFDVRH PGLPEAETQA WVDGIALYRR VDQVSGRGKC 
EGIATVKPGV VVELAGLGRR FNGKVLVTGV RHEFSLVQGW KTHVQFGGVD LEAPGKARAD 
GLLPGVSGLQ IGVVTSNEDP DGEHRVRVKL PLLGLASDGL WARVASLDAG DDRGFFFRPE 
IGDEVTVGFL ADDPRHPVIL GMLHSSAKPA PLEGSDDNHE KMLKTRSGMT VHFDDDKIVM 
TLATPAGNSI VLSEDEKSLT LADQNGNKMV MDSDGIHFES AKAVEMKAGT ETKMEATASF 
EIKAGSELKL EGSASAELKG GGMAKLSGAM VQIN