Gene Arth_3643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3643
Symbol
ID	4443644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4094962
End bp	4095984
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	61%
IMG OID	639691467
Product	ABC-type sugar transport system periplasmic component-like protein
Protein accession	YP_833118
Protein GI	116672185
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAATCA CCAAGCGTCC AGCCGCAGCG ATGGCCCTCA TGAGCCTCGC CCTGCTGACC 
TCAGCATGCG CCCCGCCTGC CCAAAGCAGC ACCACAGAAG CAGTGGCTGC CGGTGCAGAC 
CAGAAACTCA ACGTTGGATT CTTCGGCTTT GCCAAATCCA ACGGCTTTGC CCAGGGCACG 
TACCTCGGCG TGGAGCAGGC GGCGAAAGCC AACAACGCCA GCGCCACCTT CGTGGACTCC 
AATTTCAGTG CCCAGACGCA GGTCCAGCAG ATCCAGGATG CCGTCACCTC CAAGCAGTTC 
GAGGTGATCG TAGTCCAGGC AAATGACAAC CAGGCCCTCA TCGCACCTTT GACGCAGGCC 
GTACAGGCGG GCATCACGGT AGTTGTCGAA TTCTCTGTCA TCGGGCCAAA GTTCGACACC 
ATCCAGCCGC AGGTTCCTGG TGCCATCAGC ATCGTGGACC TGCCCACCCG CAACGGCAAG 
GTGCTCGGCG AGATGGGCAA GCAAGCCTGC GCCACGGTGC CGGGTGACAC GTGCAAGGTA 
GCCTACCTTG AAGGCTTCAA GTCCCTGCCC CTGGATAATG CCCGGACCGA GGCTGTGAAG 
GCGGAACTGG CAACCGATCC GAAGATCAAG CTCGTTGCCA GTGTCGAAGG CGGGTACACC 
CAGGACACCG GCCGCCAGGC ATTCCAAAAC GTCTCACAGG CGAACCCTGA TGTTGACGTG 
GTGATTGGCG CATCCCAGGC CATAACCGGG GCCGCCGCGG CCGCCGGGAA CAGTGACGTC 
AAGTTCATCG GCAACGGTGC ATCCGTTTCC AATGTGGAGG CGGTCCGGTC CGGTAAATGG 
TTCTCCATCT ACGTCAGCGA CGTCGTGGCC AACGGTGCCA AGGCCACCGA ACTGGGGCTC 
GCCAAGGCGC GGGGCAAGCA GGTGGAAACT GCCATCGACG AAGCCAGCCT GTCCCCCAAC 
AACGGCAAAG GCACTAAAGA GGCACTTGAT GCCCTGAACT ACGTCTCAAA ATACTCGGAC 
TAG

Protein sequence

MKITKRPAAA MALMSLALLT SACAPPAQSS TTEAVAAGAD QKLNVGFFGF AKSNGFAQGT 
YLGVEQAAKA NNASATFVDS NFSAQTQVQQ IQDAVTSKQF EVIVVQANDN QALIAPLTQA 
VQAGITVVVE FSVIGPKFDT IQPQVPGAIS IVDLPTRNGK VLGEMGKQAC ATVPGDTCKV 
AYLEGFKSLP LDNARTEAVK AELATDPKIK LVASVEGGYT QDTGRQAFQN VSQANPDVDV 
VIGASQAITG AAAAAGNSDV KFIGNGASVS NVEAVRSGKW FSIYVSDVVA NGAKATELGL 
AKARGKQVET AIDEASLSPN NGKGTKEALD ALNYVSKYSD