Gene Arth_1895 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1895
Symbol
ID	4445584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2133045
End bp	2134400
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	62%
IMG OID	639689707
Product	major facilitator transporter
Protein accession	YP_831379
Protein GI	116670446
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00895] benzoate transport

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.004098
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCAAT TCACGCCAAT CAAAGCCATG GCGGACGCCC GCCTTAATCG TTTTCATATC 
ATTTTGCTGC TCTGCTGCTC ATTCATCATG TTCTTCGACG GATACGACCT GATTGTCTAC 
GGCTCGGTCC TGCCAACCCT AATGACGGAA TGGTCCCTCA CCCCTGATCA GGCAGGCTGG 
CTCGGTAGCG CAGCCCTCAT CGGCATGATG ATCGGTGCCC TGACCCTCGG TTCCCTGGCC 
GACAGGATCG GACGGCGGCC AGTGGTCGTT CACGGCACAC TGCTCTTCTC ACTGGCGGCA 
ATAGCAACCG GGCTCGCTAC GACACCAGAA GCCTTCGGCG CGCTTCGGTT CCTGACCGGC 
ATCTTCCTGG GCGGCGTCAT ACCCAACATC GTGTCGCTGA TGAACGAACT CGCGCCGAGG 
GCCAACCGCC ACGCCCTGAC GACGATCATG CTCAGTATCT ACTCCGTCGG TTCAATCGTC 
GCTACGCTCG TCGCCCTCTG GGTTCTGCCT CTTCTGGGCT GGAAACCGGT CTTCTTCCTT 
AGCGGTGCAG CGCTGCTGTT CCTCCCCTTC CTGTACCGGT GGATGCCTGA GTCCATGACT 
TTTCTGATGA GCCGCGGGAA GGAAACAGAG GCCCGCGCCC TGCTTCGCCG CGCAGTGCCG 
ACCCAGAACC ACGAGCACGT GCACTGGACA GTTCCTGCCC CTCAGCACCG TCCGTCGGTT 
TCCGCGTCTC GGCTCTTTCG AGAGGGCCGG CTCCTGGGCA CCCCGATGGT GTGGCTGAGC 
TTCGGAATGT GCATGCTCAT GGTCTACGGC CTGAACACCT GGCTACCGAA AATCATGATC 
GCCGGCGGCT ACGACCTGGG ATCCAGCCTG CAGTTCCTTA TCGTCCTGAA CATCGGAGCC 
ACCGTCGGTG CCTTGGCCGG AGGCTGGCTG GGTGATCGCT TCGGAAACAA ACTGGTCCTG 
GTTATTTTCT TCGCCCTGGC CGTCGTGTCG CTGATCCTGC TGGGAACCCA CCCCGGCCCG 
GAGCTCCTCA ACATCCTCCT CTTCATCGCA GGCGCCACCA CGATCGGGAC TCTCGCCGTC 
GTCCACGCCT TTGGCGCCGA CTACTACCCG GCCGAAATAC GCTCCACCGG TGTCAGGTGG 
TGCTCAGCGA TGGGACGGTT CGGCGCCATC GCAGGGCCGA TCCTGGGCGG AGCACTGATC 
GGGCTCAAAC TGCCCCTGGG CCAGAACTTT TTGATCTTCG CAATCCCTGG CGTCATTGCC 
ATCGCCGCGG TGCTGCTGGT TGCGCGTACC AAGACCGTCG AGGAATCGCA CGCCGAACCG 
CAGCCTGCCG AATCCCAAAC GTCCAGCATC AGCTAG

Protein sequence

MTQFTPIKAM ADARLNRFHI ILLLCCSFIM FFDGYDLIVY GSVLPTLMTE WSLTPDQAGW 
LGSAALIGMM IGALTLGSLA DRIGRRPVVV HGTLLFSLAA IATGLATTPE AFGALRFLTG 
IFLGGVIPNI VSLMNELAPR ANRHALTTIM LSIYSVGSIV ATLVALWVLP LLGWKPVFFL 
SGAALLFLPF LYRWMPESMT FLMSRGKETE ARALLRRAVP TQNHEHVHWT VPAPQHRPSV 
SASRLFREGR LLGTPMVWLS FGMCMLMVYG LNTWLPKIMI AGGYDLGSSL QFLIVLNIGA 
TVGALAGGWL GDRFGNKLVL VIFFALAVVS LILLGTHPGP ELLNILLFIA GATTIGTLAV 
VHAFGADYYP AEIRSTGVRW CSAMGRFGAI AGPILGGALI GLKLPLGQNF LIFAIPGVIA 
IAAVLLVART KTVEESHAEP QPAESQTSSI S