Gene Arth_3122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3122
Symbol
ID	4444355
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3503185
End bp	3504618
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	69%
IMG OID	639690948
Product	sulfate adenylyltransferase subunit 1
Protein accession	YP_832600
Protein GI	116671667
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2895] GTPases - Sulfate adenylate transferase subunit 1
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR02034] sulfate adenylyltransferase, large subunit

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACCG AAATCGATAC AGCCCGCGCG GCCGCCCTTC TTGACGAGGC CCCCCTCGCG 
CACGCGTCGC TGTTCCGCTT CGCCACCGCA GGATCGGTCG ACGACGGCAA GTCCACTTTG 
GTGGGCCGCC TCCTGCACGA CTCCAAGGCA ATCCTCGCCG ACCAGCTCGA CGCCGTCGCC 
CGCACCTCCG CGGACCGCGG ATTTGGCGGC GCCGGGGCCA CCGGCACGAA AGCGATCGAC 
CTCGCCCTCC TGACCGACGG CCTGCGTGCC GAGCGCGAGC AGGGCATCAC CATCGACGTC 
GCCTACCGCT ACTTCGCCAC CGACCGCCGC AGCTTCATCC TGGCTGACTG CCCCGGGCAC 
GTGCAGTACA CCAAGAACAC GGTGACCGGC GCGTCCACCG CGGATGCCGT CGTCGTACTC 
ATTGACGCCC GCAAGGGTGT CCTGGAGCAG ACCCGCCGGC ACCTCTCCGT GCTGCAGCTG 
CTGCGCGTGG CCCACGTGAT CGTGGCCGTG AACAAGATCG ACCTGGTGGA CTTCAGCGAG 
GACGTGTTCC GCGGGATCGA GGCCGACGTG CAGAAGGTTG GCCGCGAACT GGGCCTCGGA 
GCCGATGGCA TCACCGACCT GCTGGTGGTT CCGGTTTCCG CGCTCGACGG CGACAACGTG 
GTGGAGCGCT CGGAGCGCAC CCCCTGGTAC ACGGGCCCGG CACTGCTCGA AGTCCTCGAA 
ACCCTTCCTG CCGCGGACGA ACTGGAAAGC CACCTGGAGA GCTTCCGTTT CCCGGTGCAG 
CTCGTCATCC GGCCGCAGGG CGCGCTGGCT CCCGACGCGG TTGCCGGCGG ACTCGACGTC 
GAGAAATACC GTGACTACCG TGCCTACGCC GGGCAGATCA CCGAAGGCTC GGTGCAGGTG 
GGGGACAAGG TCAGCGTGCT GACCCCCGGC CAGGACCCGC GCACCACCAC GGTGACGGGC 
ATCGACTTCG CGGGCGCCGA GCTCACCGAA GCCGTGGCAC CGCAGTCGGT GGCAATCCGC 
CTCGCTGACG AATTCGATGT GGCTCGCGGT GACACGATCG CCGCCGCAGG CACCGTCCGT 
GAAGCCTCCG CCGACCTCTA CGCCGCGCTT TGCTGGCTGT CCCCAAAGCC GCTCCGCGAG 
GGCGCCAAGG TGCTGGTCAA GCACGGCACG CGCACCGTGC AGGCGCTGGT CCGCAGCGTC 
AGCGGGAAAC TGGACCTCGC CACCTTCAAG CTTGAGGGCG CGTCCAGCCT GGAGCTCAAC 
GACATCGGCC ACGCGCAGCT CCGGCTCGCC GCCCCGCTGC CGCTGGAAAA CTACCTCCAC 
CACCGCCGTA CCGGCGCGTT CCTGGTGATC GATCCGCTCG ACGGCAACAC CCTGGCCGCC 
GGCCTGGTCA ATGACCACCC GGGCGACCAC GAGGACGAGC GCTACAGCAT CTGA

Protein sequence

MSTEIDTARA AALLDEAPLA HASLFRFATA GSVDDGKSTL VGRLLHDSKA ILADQLDAVA 
RTSADRGFGG AGATGTKAID LALLTDGLRA EREQGITIDV AYRYFATDRR SFILADCPGH 
VQYTKNTVTG ASTADAVVVL IDARKGVLEQ TRRHLSVLQL LRVAHVIVAV NKIDLVDFSE 
DVFRGIEADV QKVGRELGLG ADGITDLLVV PVSALDGDNV VERSERTPWY TGPALLEVLE 
TLPAADELES HLESFRFPVQ LVIRPQGALA PDAVAGGLDV EKYRDYRAYA GQITEGSVQV 
GDKVSVLTPG QDPRTTTVTG IDFAGAELTE AVAPQSVAIR LADEFDVARG DTIAAAGTVR 
EASADLYAAL CWLSPKPLRE GAKVLVKHGT RTVQALVRSV SGKLDLATFK LEGASSLELN 
DIGHAQLRLA APLPLENYLH HRRTGAFLVI DPLDGNTLAA GLVNDHPGDH EDERYSI