Gene Arth_1946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1946
Symbol
ID	4445530
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2196030
End bp	2196992
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	63%
IMG OID	639689756
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_831428
Protein GI	116670495
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1175] ABC-type sugar transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.305055
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACCC ATACCAAAAT GGCTGCCGAA CGGAAGGGCG CGGACGGCAG GACTGAAACC 
GACGCCGCGA AGGGGCGCCG CCGCTCCCCC ACGCGGGTGA ATCCAGCACT GTACCTCTTC 
CCGCTTCCGG CCGTCGCCAT TATTGCGTTC TTCCTGGTGA TGCCCACCCT GCAGGCGTTC 
CAGTACGCCA TCACGGATTG GAACGGTTTC TCGGCGGCGT TCAACTACGT GGGGCTGGAC 
AACTTCGTCC GAGCCTTCAC CAAGGACTCG CTTTTCACCA ACGCGCTGAC CAACAACTTG 
AAGTTTGTGC TGATGGTGGT GATCGCGCAG ACCGCGTTTT CGCTGGTGCT GGCCCTGCTC 
CTGACGAAGA ACTCGCGCGG CAGCATCCTG CTCCGGGCGC TGTTCTTCTT CCCCACCATC 
CTGTCCTCCG TCTCCGTGGC CTTCATCTGG AAGTTCATCT ACGACCCCAA CTTCGGCCTC 
GCCAACGCGG TCCTGGGCGG CGTGGGCCTC GAAGCCCTGC AGGGTTCCTA CCTCGGCAAC 
AATGCCCAGG CCCTGTACTG GGTGGCCGTG ACGCAGGTCT GGTTCCACGC AGGGCAGATG 
ATGGTGGTTT ACATCGCCGG CCTCCAGGCC ATCCCCCGGG AACTCTACGA GGCCGCGGAA 
ATGGACGGCG CCGGCAAATG GCAGCAGTTC AAGTCCATCA CCTGGCCGTT TGTGGCCCCT 
GCAACGTCCA TCGTGGTGGC CTACACCACC GTCCAGTCGT TCAAAGCCTT CGACCTGATC 
CTGGGCATCG CGGGGAACCC GCCCAAGCAG TCCCTGGATA TCCTCTCCAC CCGCATCTAC 
AGCACCTTTG CCAACTCGGA GTTCGGCTAC GCCGCCGCCC AGTCGATCAT CTTCATGGCG 
ATGATCGCCC TGGTCACCTG GCTCCAGCGC CGTTTGCTCC GGCTGACCCC GAAGGGGGAA 
TGA

Protein sequence

MSTHTKMAAE RKGADGRTET DAAKGRRRSP TRVNPALYLF PLPAVAIIAF FLVMPTLQAF 
QYAITDWNGF SAAFNYVGLD NFVRAFTKDS LFTNALTNNL KFVLMVVIAQ TAFSLVLALL 
LTKNSRGSIL LRALFFFPTI LSSVSVAFIW KFIYDPNFGL ANAVLGGVGL EALQGSYLGN 
NAQALYWVAV TQVWFHAGQM MVVYIAGLQA IPRELYEAAE MDGAGKWQQF KSITWPFVAP 
ATSIVVAYTT VQSFKAFDLI LGIAGNPPKQ SLDILSTRIY STFANSEFGY AAAQSIIFMA 
MIALVTWLQR RLLRLTPKGE