Gene Dshi_3824 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_3824
Symbol
ID	5714353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009956
Strand	-
Start bp	30459
End bp	31769
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	66%
IMG OID	641276739
Product	phenylacetate-CoA ligase
Protein accession	YP_001542035
Protein GI	159046364
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1541] Coenzyme F390 synthetase
TIGRFAM ID	[TIGR02155] phenylacetate-CoA ligase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0827131
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.36821
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGACC TGAGCCCGAA CCGGGCGGAG CTGGACCCGA TCGAGATCGC CAGCCGCGAC 
GAGATTGCGG CGCTCCAGCT CGACCGGATG AAATGGTCCC TGCGCCATGC CTATGACAAT 
GTGCCGATGT ATCGCGCCCG GTTCGACGCG GCCGGGGTGC ATCCCGACGA CCTGCGCGAC 
TTGAAGGATC TCGCGAAGTT TCCCTTCACC CACAAGAGCG ACCTGCGCGA CCACTATCCT 
TTCGGCATGT CGGCGGTGCC GCGCGACAGG CTGGTGCGGG TGCATGCCTC GTCGGGGACC 
ACGGGCAAGC CGACGGTGGT GGTCTATACC CGCCACGATA TCGAGGTCTG GGCCGACACC 
CTGGCGCGCA GTCTGCGGGC CTCCGGCCTC AGGGCGGGCG ACATGATCCA CAATGCCTAT 
GGCTACGGGC TGTTCACCGG GGGTCTGGGC GCCCATTACG GCATCGAGAA GCTGGGCGCG 
ACGGTCATTC CCATGGGCGG CGGGCAGACC GAAAAGCAGG TCAGCCTGAT CCATGATTTC 
CGGCCGACCG CCATCATGGT GACGCCGTCC TACATGCTCA ATATCCTTGA AGGGTTCCAC 
AAGGCGGGTC TGGATCCGCG GCAATCCTCG TTGCAGGTGG GCGTGTTCGG GGCCGAGCCC 
TGGACCAACG CCATGCGCCA GGAGGTCGAA GAGGCCTTCG ACATGCACGC GGTGGACATC 
TACGGGCTGA GCGAGGTCAT GGGGCCGGGG GTGGCCAATG AATGCGTGGA GACCAAGGAC 
GGGCTCCATG TCTGGGAAGA CCATTACTAT CCGGAGATCA TCGACCCGCA GACCGGCGAG 
GTGCTCAAGG ACGGTGCGGA GGGCGAGCTG GTCTTCACCA CCCTGACCAA GGAGGGGATG 
CCGATGATCC GCTACCGCAC GCGCGATCTG ACCCGGCTTC TGCCCGGCAC GGCGCGCAGC 
ATGCGGCGGA TCGAAAAGAT CACCGGGCGC TCCGACGACA TGATGATCCT GCGCGGGGTC 
AATGTCTTTC CGACCCAGAT CGAGGAACAG GTGATGGCCA CCGGCGGGCT GGGCCCGTAT 
TTCCAGATCG AACTCTACAC CTCGGGGCGG CTGGACGCGA TGCGGGTCTT CGTCGAGGCG 
ACCCCGGCGG CGGCGGACGA GCTGTCGAGA ACCGCCGCGG CCCGTGTCCT GACCAAGCAT 
GTCCGGGACA TGGTCGGGGT GTCCATCGAA GTGGTCGTCG GCGACCCCGG CTCGGTCGCG 
CGCAGCCAGG GCAAGGCCGT CCGCGTCATC GACAACCGCA AAAAGGACTA G

Protein sequence

MKDLSPNRAE LDPIEIASRD EIAALQLDRM KWSLRHAYDN VPMYRARFDA AGVHPDDLRD 
LKDLAKFPFT HKSDLRDHYP FGMSAVPRDR LVRVHASSGT TGKPTVVVYT RHDIEVWADT 
LARSLRASGL RAGDMIHNAY GYGLFTGGLG AHYGIEKLGA TVIPMGGGQT EKQVSLIHDF 
RPTAIMVTPS YMLNILEGFH KAGLDPRQSS LQVGVFGAEP WTNAMRQEVE EAFDMHAVDI 
YGLSEVMGPG VANECVETKD GLHVWEDHYY PEIIDPQTGE VLKDGAEGEL VFTTLTKEGM 
PMIRYRTRDL TRLLPGTARS MRRIEKITGR SDDMMILRGV NVFPTQIEEQ VMATGGLGPY 
FQIELYTSGR LDAMRVFVEA TPAAADELSR TAAARVLTKH VRDMVGVSIE VVVGDPGSVA 
RSQGKAVRVI DNRKKD