Gene Arth_0134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0134
Symbol
ID	4447397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	135687
End bp	137156
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	66%
IMG OID	639687929
Product	amino acid/peptide transporter
Protein accession	YP_829635
Protein GI	116668702
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3104] Dipeptide/tripeptide permease
TIGRFAM ID	[TIGR00924] amino acid/peptide transporter (Peptide:H+ symporter), bacterial

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACAA CTCATTTATC CGACCGCCCC GCTACAACGC CGGGCGATAC GTCATTTTTT 
GGCCACCCAA AGATGCTGGC CAGCCTCTTC TCCGTAGAAA TGTGGGAGCG TTTCTCCTTC 
TACGGGATGC AGGGCATCCT CCTCTATTAC ATGTACTTCA CGGCCGCGCA GGGCGGCCTC 
GAAATCGAGC AGGGCCTGGC CGCCGGCCTG GTGGGCGCCT ACGGCGGCGG AGTCTATCTC 
TCCACCATTC TGGGCGCGTG GCTGGCCGAC CGGCTCTTCG GTTCGGAACG GGTCCTGTTC 
GGCTCGGCCG TCCTGATCAT GGCGGGCCAC ATCGCCTTGG CGCTTGTCCC GGGCATTCCC 
GGACTCATCG CCGGCCTGGT GCTGGTGGGC GTCGGCTCGG GCGGCCTCAA GGCAAATGCC 
ACCGCGCTGG TGGGCACCCT GTACGGGGAG AAGGACGAAC GCCGCGACGC AGGCTTCTCC 
ATCTTCTACA TGGGCATCAA CGCCGGCGCG CTGATCGGCC CGCTGGTTAC CGGCTGGCTG 
CAGGAAAGCC GGGGGTTCCA CTGGGGCTTC GGCGCCGCCG CCGTCGGAAT GGCCCTTGGC 
CTGGGCATCT ACGCGATGGG ACGCGGGAAG CTCCCCGAAG CGGCGCACCA CGTGCCCAAC 
CCGCTCCCTG CGGCCCAACG CACCAGATAC GGGCTGATCT TCCTGGGCAT CGCCGCCGTG 
GTGGCGGTTC TCCTGGCCAC CGGCGCCGTG AACGCCGAGA ACCTGGCCAT GTCCATGGCG 
TACGCGGCCA TCGGCGCTTC CGTGCTCTAC TTCGGCCTGA TCTTCTCCAG CAGGAAGGTG 
ACGGGCGTCG AGCGCAAGCG CGTGGTGGCC TTCATCCCGC TGTACATCGC CTCCGCGGCG 
TTCTGGGCAC TGTTCCAGCA GCAGTTCACG TTCATTGCCG TGTACTCAGA GGAGAAGCTG 
GACCGGAACC TCTTCGGCTG GGAGATGCCT GCCGCCTGGG TGCAGTCGAT CAACCCGGTG 
TTCATCATCA TCTTTGCCGG CGTCATGGCG GCCCTGTGGA CCCGGATGGG CAACAAGCAA 
CCCGGATCGG CCCTGAAGTT CTCCATCGGC CTGTTCGTGA TGGGCCTGGC CTTCCTGGCC 
TTCATTCCGC TGGCCGGCAG CGGCAAGACG CCCCTCCTGG CACTGGTGGG CATCCTGTTC 
CTGTTCACCC TGGCGGAGCT TTTCCTCTCC CCCATCGGGC TGTCCGTCAC CACCAAACTG 
GCACCCCAGG CCTTCCATAC GCAGATGGTG GCCCTGTTCT TCCTGTCCGT TTCGCTCGGC 
ACCACCCTGG CCGGCATACT GTCCGGGCTG TATAACCCGG ACGACGAACT GCCGTACTTT 
ACCGGTATCG GCGGCACGGC CATGGTGCTG GCCGTCGGCC TCGCTGCCGC CTCGCCGGCC 
ATCAAGAAGC TGATGGCCGG CGTACGCTGA

Protein sequence

MSTTHLSDRP ATTPGDTSFF GHPKMLASLF SVEMWERFSF YGMQGILLYY MYFTAAQGGL 
EIEQGLAAGL VGAYGGGVYL STILGAWLAD RLFGSERVLF GSAVLIMAGH IALALVPGIP 
GLIAGLVLVG VGSGGLKANA TALVGTLYGE KDERRDAGFS IFYMGINAGA LIGPLVTGWL 
QESRGFHWGF GAAAVGMALG LGIYAMGRGK LPEAAHHVPN PLPAAQRTRY GLIFLGIAAV 
VAVLLATGAV NAENLAMSMA YAAIGASVLY FGLIFSSRKV TGVERKRVVA FIPLYIASAA 
FWALFQQQFT FIAVYSEEKL DRNLFGWEMP AAWVQSINPV FIIIFAGVMA ALWTRMGNKQ 
PGSALKFSIG LFVMGLAFLA FIPLAGSGKT PLLALVGILF LFTLAELFLS PIGLSVTTKL 
APQAFHTQMV ALFFLSVSLG TTLAGILSGL YNPDDELPYF TGIGGTAMVL AVGLAAASPA 
IKKLMAGVR