Gene Arth_3083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3083
Symbol
ID	4444316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3453965
End bp	3454951
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	62%
IMG OID	639690910
Product	ABC-type nitrate/sulfonate/bicarbonate transport systems periplasmic components-like protein
Protein accession	YP_832562
Protein GI	116671629
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.261971
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGTC GATTTATTGC CGTTCTGGCA GCCGCGTCTG TTCTGGGATT GTCGGCCTGC 
GGAAGTGGCT CGCCCAGTTC CACGGGAGGC GGAACTGCCT CGGGCACCGC CGGTGGAGGT 
TCGGACCTGA CGAAGGTCAG CGTCGGTGTC ATTCCCATCG TCGACTGCGC CCCCATCTAC 
CTCGGAGACA AGCAGGGCTT CTTCAAGGAA GAGGGCCTCC AGCTGGACAT CCAGACCGCA 
ACCGGCGGTG CGGCGATCGT CCCCGGTGTC GTCAGTGGCA GTTTCGACTT CGCGTTCTCA 
AATCTGATCT CGGTGATGGT CGCCAAGGAC AAGGGCCTTG ACCTGAAATT CGTCGCCAAC 
GGTGCGTCCA CCACCGGGGA AAAGGGCAAG GACATCGGCG GCGTCGTCGT GCCGGCAGGC 
TCAAGCATCC AGTCCGGGAA AGACCTCGCA GGCAAGACCG TTTCGGTGAA CAACCTCTCC 
AACATCGGCG ACACCACCAT CAAGTCGGTC GTCGAAAAGG ACGGTGGTGA CCCCAAGAGC 
GTGAAGTTCG TCGAGGTGGC CTTCCCGGAC GCCCCGGCGG CCCTGGCCAA CAAGCAGGTG 
GATGCGGCGT GGATCCTTGA GCCCTTCCTG TCCAAGGCCG TGGCTGAAGG CGGCAAAGTG 
GTTTCCTGGA ACTTCGTCGA GATGAGCCCG GAGCTGGACA TCGCCGGCTA CTTCACCAAG 
GGAGACACCA TCAAGGGCAA GGCTGAGCTC ACGCAGAAGT TCACCCGTGC CATGAACAAA 
TCGCTTGAAT ATGCGCAGCA GCACCCGCAG GAGGTCCGCG ACATCGTGGG CACCTACACG 
AAGATCGACG AGGCTGCCCG GGCCAAGATC GTGCTGCCGC GGTACCGGGT CGACTTCAAC 
AAGGATGCGT TCAAGACCCT CGGCGACGCC GCCGCCAGCT ACGGCACGCT GACCAAGGCT 
CCGAACGCAG ACGAACTCCT CCCGTGA

Protein sequence

MKRRFIAVLA AASVLGLSAC GSGSPSSTGG GTASGTAGGG SDLTKVSVGV IPIVDCAPIY 
LGDKQGFFKE EGLQLDIQTA TGGAAIVPGV VSGSFDFAFS NLISVMVAKD KGLDLKFVAN 
GASTTGEKGK DIGGVVVPAG SSIQSGKDLA GKTVSVNNLS NIGDTTIKSV VEKDGGDPKS 
VKFVEVAFPD APAALANKQV DAAWILEPFL SKAVAEGGKV VSWNFVEMSP ELDIAGYFTK 
GDTIKGKAEL TQKFTRAMNK SLEYAQQHPQ EVRDIVGTYT KIDEAARAKI VLPRYRVDFN 
KDAFKTLGDA AASYGTLTKA PNADELLP