Gene Arth_4017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4017
Symbol
ID	4447818
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4536024
End bp	4537010
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	64%
IMG OID	639691848
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_833492
Protein GI	116672559
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0601] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTCCGTT ACCTCGCCAA AAGGGCAGTT ACCTACCTGC TCATGATTTT CCTGACCACC 
ACGGCGGGGT ACTTCCTCGC CGTCAGCACG CTTCAGCCGG CGCTGCTGGA GCAGGAACGC 
ATTCCGCGGC CGACGCCCGA GCAGGTGACA AACTCCTTCC GCCTCAAGGG CCTTGATCCG 
ACGCTGAGCC CGTGGGAGCG CTACGTTGAC TGGCTGACGG CAGTGGTCAC GCGCTGGGAC 
TGGGGCCGAA GCCCCAACGG CGCTTTCATC AATGCCGAGT TCGGCGACCG CGTCTGGATC 
TCTACCCGGC TGTTCCTGGC CTCCATCGTC CTCACCCTGA TCATCGGCGT GGCACTGGGC 
GTGTACACCG CAGCCCGGCA GTACAAGTTT TCCGACCGCG CGATCACCTC TTACAGCTAT 
CTCGTATACA TCGTGCCCGC GCCCATCGCG TACTTCCTGG TCCAGCTGGG TGCCATCAAC 
ATCAACGAAA CGGTCGGCGA ACGGATTCTA TTCGTCACCG GCATCTCCAC CCCCGGGCTG 
GAAGGCAACG GCTGGGTCCA GTTCCTGGAC ATGCTGGCCC ACTACGCCGT GCCCACGTTT 
GCCATCACCA TCGTGGGCTG GGGGACCTAC CAGATCGCCC AGCGCCAGTA CCTGCTGGAC 
AACGTCAACG CCGACTTTGT CCGGACGGCC CGGGCCAAGG GCCTCACCCG CAACCAGGCC 
ATCACCCGCC ACGCCCTTCG GGTCTCGTTC ATCCCGGTGG CGCAAAGCAT TGCGTTCACC 
ATTCCGGCCA TCTTCGCCGG CGGATTCTTT GCCGAGAAGA TCTTCGCCTG GCACGGCGTC 
GGCTCCTGGA GCATCGACGC GATCGCCTTG CAGGACGTGA ACGCGGCCAC GGCCACTTTG 
GCTTACGGCT CGGTGATTTT CGCGATCGGA GCCATCCTCG CGGACTTTGC CACCACCCTT 
GTCGACCCGA GAGTGCGGGT GCAGTAG

Protein sequence

MFRYLAKRAV TYLLMIFLTT TAGYFLAVST LQPALLEQER IPRPTPEQVT NSFRLKGLDP 
TLSPWERYVD WLTAVVTRWD WGRSPNGAFI NAEFGDRVWI STRLFLASIV LTLIIGVALG 
VYTAARQYKF SDRAITSYSY LVYIVPAPIA YFLVQLGAIN INETVGERIL FVTGISTPGL 
EGNGWVQFLD MLAHYAVPTF AITIVGWGTY QIAQRQYLLD NVNADFVRTA RAKGLTRNQA 
ITRHALRVSF IPVAQSIAFT IPAIFAGGFF AEKIFAWHGV GSWSIDAIAL QDVNAATATL 
AYGSVIFAIG AILADFATTL VDPRVRVQ