Gene Arth_1914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1914
Symbol
ID	4445568
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2154032
End bp	2155018
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	62%
IMG OID	639689724
Product	inner-membrane translocator
Protein accession	YP_831396
Protein GI	116670463
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCAAGG CAAACACCAT CGCGCCCCGG GACACCGCGG CACCACGCAA TTTCGGCACC 
ATCCTGAAAG AACTCGACTG GCGACGTTAC GTCATCTACA TCGGCTTTGT CGTCGTCTTC 
CTCTTCTTCG CCATTCTGCT CCGCGATCAG GGCTTCCTGT CGCCGAACAA CCTGCTGAAC 
ATTTTCCGGC AAACTGCCAC AATCACCGTC ATCGCCGTAG GTATGACATA CGTCATCTCT 
TGTGCAGAAA TCGACCTAAG CGTCGGATCG GTGGCCGGGT TGTCCAGCGT CTGCACGGCC 
ATGGCGTTGT CCCAGTGGGG CCTGATCCCC GGAATCCTCG CCGGCCTTGC CGTCGGCCTC 
GTGGTCGGGT CAATAAATGG CGCACTGGTC AGTCTCCTTG GCATCCCCTC CTTCCTCGTG 
ACGCTCGGCA TGCTGGGTAT CGCCGTCGGA GTCGCCCAGT GGATCACGGC CTCAGCCCCC 
CAGCCGATCC TGAATGACAC CTTCAACATG CTGTTCGGAT CCGGTGACTT CGGCCCCGTA 
CCGGGCCTGG TTGTCTGGAG CGCCATCTTC GTTGCCATCG GCGCCGTCGT ACTGAACCGC 
ACCAAGTTCG GCCGACAGGT CCTAGCTACC GGCGGTAACC GCAACGCCGC GGAATTCACG 
GGCATCAACA CCAAACGAAT CAAATTCCAG GTGCTCCTCA TCTCCGGCAT GGTCGCGAGC 
GTTGCCGGCA TGCTGTACGC CGGCCGCCTC CAGTCCGGCC GCTTCCAGTG GGGATCGGGC 
GATGAGCTCT CCGCCATCGC CGCCGTCATC CTCGGCGGGA CAAGCCTGTT CGGCGGATTT 
GGCTCCATCA TGGGAACGCT CTTCGGCGCC CTCCTGATTG GCTTGATCAA CAACGGACTG 
ATCCTGGCCG GCCTCGACAG CAGCCAGCAG CAGGTGGTCC GCGGCGCCAT CATCATCCTG 
GCCGTCGCCC TCGCCCGGAA GAAATAG

Protein sequence

MSKANTIAPR DTAAPRNFGT ILKELDWRRY VIYIGFVVVF LFFAILLRDQ GFLSPNNLLN 
IFRQTATITV IAVGMTYVIS CAEIDLSVGS VAGLSSVCTA MALSQWGLIP GILAGLAVGL 
VVGSINGALV SLLGIPSFLV TLGMLGIAVG VAQWITASAP QPILNDTFNM LFGSGDFGPV 
PGLVVWSAIF VAIGAVVLNR TKFGRQVLAT GGNRNAAEFT GINTKRIKFQ VLLISGMVAS 
VAGMLYAGRL QSGRFQWGSG DELSAIAAVI LGGTSLFGGF GSIMGTLFGA LLIGLINNGL 
ILAGLDSSQQ QVVRGAIIIL AVALARKK