Gene Arth_3854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3854
Symbol
ID	4447553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4336688
End bp	4337815
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	65%
IMG OID	639691678
Product	diguanylate phosphodiesterase
Protein accession	YP_833329
Protein GI	116672396
COG category	[T] Signal transduction mechanisms
COG ID	[COG2200] FOG: EAL domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAATGG ATGAGACTTC TTTTCCAGCA TTGACCGATG GAGAATCCAC TGCTTTCCGG 
GGACCGCAGT CGGTGCCGCC TTCGGACGTG AGTGATCCGA CGATCCGTGG ACAGGCGCGG 
GACATCATCG AGTCTGTACT GGGTGACGCC ACTCCGCAGA GCGAGTGGGC TCGTGAACAG 
TTGCGAAGCC GGATGGAATC GTACCCGGGT AATCCCGAAC GCGCCCTCCT TGAGCACCTC 
ATGGCCACCC GGAGCATCAC GGACGAGCAG CCGGAAGAAA CCGAGGCCAC CCTTCCCAGC 
CCCGACTTGC CGACTCCCGA TGAGGACTAC GGCAACACGG TGCTGTTCAC CCGCCGGAGC 
AGGCGCCGCA TCGAGGCGAT CCTCGGCGAC AGGATGCTCC TCACCGCGTT CCAGCCCATC 
CACGAGCTTC GCAGCCGGAA CGTCGTTGGT GTTGAGGCGC TGACGCGTTT CGTCAGTGAC 
GACGGCGCGA GTGCGGACCA CTGGTTCAAT GAGGCTGCTG CCGTAGGCCT CGGACCCGAC 
CTTGAATTCG CTGCCCTGCA GGCGGCACTC GTTGCCGCCG AACAACTGCC GGCCCACGTC 
TACGTGGCTC TGAACCTGTC ACCGGTCACC TGCCTGGACC CCCGGCTCCG GGCGTTCGTG 
GAGCAATCCC AACTGGCCGT GGACCGGATC GTCATCGAGT TGACGGAGCG GCTTGCCGAG 
CATGAATACG ATCCCGTCGT GGCAGCGCTG GCACCCCTCC GCTTGCGCGG ACTGCGGGTA 
GCTGTCGACG GCGCCGGAGC GGGTTTCGGC TCGATGAGCC AGGTCACGCA CCTCAGTCCG 
GACATCATCA AGCTCGACCG CAGCCTCATC GCGGGAATCG ACCATGCCGC GGGCCAGAAG 
ACCCTGGGCG CGGCCATGGT GGAGTTCGCC CGGCAAATCG GCGCGGACCT GGTTGCCGAA 
GGAATCGAAA CCCAGGCCGA GCTCACCTCG GTGATGGACC TTGGGATGGC CTACGGGCAG 
GGATACCTCC TGGGCCGTCC CTCGGTCCAG CCCCTCGACT GGGCCGCCTG GCGAACCTCC 
TCCGATCACG AAGCCTCCAT TTCGGGGTCC GCCGGCCCGG CCAACTAG

Protein sequence

MSMDETSFPA LTDGESTAFR GPQSVPPSDV SDPTIRGQAR DIIESVLGDA TPQSEWAREQ 
LRSRMESYPG NPERALLEHL MATRSITDEQ PEETEATLPS PDLPTPDEDY GNTVLFTRRS 
RRRIEAILGD RMLLTAFQPI HELRSRNVVG VEALTRFVSD DGASADHWFN EAAAVGLGPD 
LEFAALQAAL VAAEQLPAHV YVALNLSPVT CLDPRLRAFV EQSQLAVDRI VIELTERLAE 
HEYDPVVAAL APLRLRGLRV AVDGAGAGFG SMSQVTHLSP DIIKLDRSLI AGIDHAAGQK 
TLGAAMVEFA RQIGADLVAE GIETQAELTS VMDLGMAYGQ GYLLGRPSVQ PLDWAAWRTS 
SDHEASISGS AGPAN