Gene Arth_1154 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1154
Symbol
ID	4446354
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1251944
End bp	1253293
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	63%
IMG OID	639688961
Product	extracellular ligand-binding receptor
Protein accession	YP_830648
Protein GI	116669715
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.443442
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTTCAC TCCCCCAGGC GGCGCCGCGA GTCGCTAAGC TCACAGCGCT TAGCATCGGC 
GTCGCCCTTC TGGCTACGGC TTGTGGCGGC TCGTCCACCC CGAGTTCGAC AGGCTCCACC 
ACTCCGGCGG CATCCGGAAT CGCCTGCCCG GCGCCGAGCG CTAGCGGCGG CGCCACCACC 
GCAGCGGGCG CGGGCGGCTC GGTCCCGGCC TCTACCACTA CTACGGATAC TCCGCTCAAG 
ATCGGCTCGC TTCTGCCTAC CACGGGCTCG CTGGCGTTCC TCGGGCCGCC CGAAATTGCC 
GGTGTGAACC TGGGCATCAA GGAAGTCAAT GACGCAGGCG GCGTCCTGGG CAAGCCCGTC 
GAAGTGATCC ACCGCGACTC CGGTGACACC AAGACCGACA TTGCAACGCA GTCCACCACA 
GCGCTGCTGG GCAGCGGCGT CAGCGCCATT ATCGGCGCTG CATCATCGGG GGTTTCCAAG 
ACCGTCATCA ACCAGATCAC CGGTGCCGGT GTCATCCAGT TCTCGCCCGC GAACACGTCT 
CCCGACTTCA CCACCTGGGA TGACAAGGGC CTCTACTGGC GCACGGCTCC CTCCGATGTG 
CTGCAGGGCA AGGTGCTCGG CAACTACATG GCTACCTGTG GCGCACAGAC CGTCGGCATG 
ATCGTTCTGA ACGATGCGTA CGGCACCGGC CTGGCCAAGA ACGTCAAGTC TGCGTTTGAA 
GCTGCCGGCG GCAAGGTTGT TGCCGAGGAG CTCTTCAACG AGGGCGACTC GCAGTTCAGC 
AGCCAGGTGG ACAAGGTCAT TGCAGCCAAG CCGGATGCGA TTGCCCTGAT CACCTTCGAC 
CAGGCTAAGA GCATCGTGCC CCTGATGACC GGCAAGGGCA TCAAGGCGAC CCAGATGTTC 
CTGGTTGACG GCAACACCTC GGACTACAGC AAGGACTTCC AGGCGGGAAC GCTGAAGGGC 
GCCCAGGGCA CCATCCCGGG CACGTTCGCC AAGGACGACT TCAAGAAGAA GCTGCTGGCA 
ATCGACCCGG CGCTGAAGGA CTACAGCTAT GCAGGCGAGT CGTACGACGC CGTCAACCTG 
ATCGCGCTGG CTGCGGAAGC CGCTAAGAGC ACCAAGGGTA CCGACATCGC CAAGCAGCTC 
AAGGCAGTCT CCGAAAGCGG CGAGAAGTGC AACGACTTCC CGTCCTGCGT CACGCTGCTC 
CGCAACGGCA AGGACATCGA CTACGACGGC CAGTCCGGTC CGGTGACCTT CTCCGACGCC 
GGTGACCCGA CGGAAGCCTA CATCGGCATC TACGAGTACC AGGATGACAA CACCTACAAG 
CCGTCGAAGG AAGAATTCGG CAAGCTGTAA

Protein sequence

MISLPQAAPR VAKLTALSIG VALLATACGG SSTPSSTGST TPAASGIACP APSASGGATT 
AAGAGGSVPA STTTTDTPLK IGSLLPTTGS LAFLGPPEIA GVNLGIKEVN DAGGVLGKPV 
EVIHRDSGDT KTDIATQSTT ALLGSGVSAI IGAASSGVSK TVINQITGAG VIQFSPANTS 
PDFTTWDDKG LYWRTAPSDV LQGKVLGNYM ATCGAQTVGM IVLNDAYGTG LAKNVKSAFE 
AAGGKVVAEE LFNEGDSQFS SQVDKVIAAK PDAIALITFD QAKSIVPLMT GKGIKATQMF 
LVDGNTSDYS KDFQAGTLKG AQGTIPGTFA KDDFKKKLLA IDPALKDYSY AGESYDAVNL 
IALAAEAAKS TKGTDIAKQL KAVSESGEKC NDFPSCVTLL RNGKDIDYDG QSGPVTFSDA 
GDPTEAYIGI YEYQDDNTYK PSKEEFGKL