Gene Arth_1778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1778
Symbol
ID	4445677
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1989623
End bp	1991065
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	65%
IMG OID	639689596
Product	mercuric reductase
Protein accession	YP_831268
Protein GI	116670335
COG category	[C] Energy production and conversion
COG ID	[COG1249] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide dehydrogenase (E3) component, and related enzymes
TIGRFAM ID	[TIGR02053] mercuric reductase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.3364
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCGGCAG CATCTTTCGA TTATGACCTG GCCATTATCG GTTCCGGCGG GGCTGCTTTC 
GCTGCGGCCA TCCGGGCAAC CAGCCGTGGC AAGCGGGTGT TGATGGTGGA GCGCAGCACT 
GTGGGAGGCA CGTGCGTGAA CACGGGCTGC ATCCCGTCCA AGGCCCTGCT GGCCGCCGCG 
GAAGCCCGCC ATGTCGCCCT CGATGCTTCC GGACGGTTCC CCGGTATCAG CACCTCCGCA 
GAGCCGGTGG ATATGCCCGA ACTGGTCGCC GGGAAGCGCT CACTGGTCGA ATCCATGCGG 
TCAGAGAAGT ATGTGGATCT CGCCGCGGGC TATGGATGGA ACCTGCAGCG GGGGACGGCG 
GTGTTCGCCG GAACCGCAGC CGCACCGGTT TTGAACATCA CCGCCCCGGG CGGAACCACC 
GAGACAGTCA GCGCGGAACA CTACCTGGTC GCGACCGGCT CCACCCCCTG GATCCCTGAA 
GTGCCGGGAA TGGACGAGGT GGATTATCTG ACGTCCACGA GTGCGATGGA GCTGCAGGAC 
GTTCCCGCTT CGATGCTGGT GGTGGGCGGC GGGTATGTGG CGCTGGAGCA GGCGCAGCTT 
TTCGCCCGGC TCGGCACGGA GGTGACCATC CTGGTCCGGT CCAAGCTCGC CTCGGCCGAA 
GAGCCTGAAG CCGGGCATGC CCTCGCCGGT GTCTTCGCCG ATGAGGGTAT CCGGGTCGTC 
CGTCGAGCGA CAGCGTCCTC GGTCCGGACC GATGAGGTGT CGGGGGACGT GGTCGTGGAT 
GCTTCCGTCT CAGGAGGAAA CGAGGAATTC AGGGCCGCGC GCCTGCTCAT GGCAACAGGC 
CGGCGCCCGG TCACGGAGGA TTTGAACCTT TGCATGGTCG GCGTTGAAAC CGGGGACCGC 
GGGGAAGTCC TGGTCGACGG GAGCCTTCGC AGTACTAATC CGAGGATCTG GGCCGCGGGT 
GATGTGACGG GTCACCCGGA GTTCGTTTAT GTCGCCGCCG CGCACGGGGC CCTGATGGTG 
GAGAACGCCT TTGAGGGTGC CGGGCGTGAG GTCGATTACC GGCACCTGCC CCGGGTCACG 
TTTACCAGCC CTGCCCTGGC CGCTGTCGGG ATGACGGACA AGGAAGCGAA CCAGGCAGGG 
ATCCGGTGCA TGTGCCGGGT TCTGCCGCTC AAATTTATCC CTCGCGCGCT GGTGAACCGT 
GATACCCGCG GCTTCATCAA GATCGTTGCC GACGCGGACA CGGGTCGGAT TGTAGGGATC 
ACTGTCGTGG GTAAGGACGC CGGGGACATC GCCGCCGCAG GGATTTACAT TCTGGAGGCC 
GGGATGACCG TTGATCAGGT CGCGAATCTC TGGAGCCCCT ATCTGACCAT GGCCGAAGGC 
ATCAAGATAG CAGCCCAGTC CTTCACTACT GACGTCTCCA AACTGTCCTG TTGCGCGGCA 
TGA

Protein sequence

MSAASFDYDL AIIGSGGAAF AAAIRATSRG KRVLMVERST VGGTCVNTGC IPSKALLAAA 
EARHVALDAS GRFPGISTSA EPVDMPELVA GKRSLVESMR SEKYVDLAAG YGWNLQRGTA 
VFAGTAAAPV LNITAPGGTT ETVSAEHYLV ATGSTPWIPE VPGMDEVDYL TSTSAMELQD 
VPASMLVVGG GYVALEQAQL FARLGTEVTI LVRSKLASAE EPEAGHALAG VFADEGIRVV 
RRATASSVRT DEVSGDVVVD ASVSGGNEEF RAARLLMATG RRPVTEDLNL CMVGVETGDR 
GEVLVDGSLR STNPRIWAAG DVTGHPEFVY VAAAHGALMV ENAFEGAGRE VDYRHLPRVT 
FTSPALAAVG MTDKEANQAG IRCMCRVLPL KFIPRALVNR DTRGFIKIVA DADTGRIVGI 
TVVGKDAGDI AAAGIYILEA GMTVDQVANL WSPYLTMAEG IKIAAQSFTT DVSKLSCCAA