Gene Arth_3167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3167
Symbol
ID	4444227
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	3557263
End bp	3559176
Gene Length	1914 bp
Protein Length	637 aa
Translation table	11
GC content	64%
IMG OID	639690993
Product	S-layer domain-containing protein
Protein accession	YP_832645
Protein GI	116671712
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTTAA TAAAACGCCC CGCCCGCACC CGCTACCTCG TTGTGGCAGC CCTCGTGGCC 
GGGGCGTCAA CTCTGGCCGG TCCGGCAGTT CCGGCGCAGG CGTCAGAAGC CTGCGTCCTC 
GTTCCCAACG GGGCTTACAC ATGTTTCGAC CGCGGCGACG AAGGTGCCGG CGAATGTCCC 
GGTGGCGCGT GGGTCGGCCC GGACAACGTG GTGCACTACG GTCCTCAACC GGAGCGGTTC 
CAGAACTGGC TGTTCGCCCC GTCACCGCTG ATTGCGGGCC GTCCCGCCGT CGGAAGGACG 
CTTACGGTCC AGCCCTGCAA CTGGGTTCCG GACCCCGTCA CGCTGCACGT CCAGTGGAAG 
CGGAACGGGC GTGCCATTCC CGGAGCGACC GGACAGTCCT ACACGCTGAC CGAGTCGGAC 
CAGGGCAAAG CCATAACGGT GACCGTGACC GGATCGAAGG CAGCCTTCGC CAGTCTGGCG 
CGGACCAGCG CACCCACGGC CGTTATTGCT CTCGCTGAGT CATACGTCGA TCCGCCGGCG 
CCGGAAATCG TCGTCGGAAA CTCCGTCACG AGCGTCGGCA CGCGGCTGTA CGCGACCAAT 
ACTTGGCGGT ACACCGAGCT GTCATATTCC CACCAGTGGA AGCGCGACGG TGCAGCTGTG 
GACGGAGCCA CTGGCGAAGA GTACGTCCTG ACGACGGCGG ACATCGGCCA CAAAATGACG 
GTGACCCGGA CGGGCTGGCG CCCTGGATGG GCCACGGTGA CAAAGTCCAG CGCCCAGTCC 
GACGTCGTGG TGGCGGGTCC CCCGCCGTCG TTCACCCTGC CGCCGGACAC CACGGCACCG 
GTGGTGGCTC CCTCCCTTGC CCAGGGAACG TACCTCTACG GCCAGGCACT TTCCCTCGCG 
GCAGATGAGA CCGCTGACAT CTTCTACACA ACAGACGGTT CGACGCCGAC GCAAAGCAGC 
GGCCGTTACA GCGGCCCCTT CTCCCTGGAC AGGACCACCG AGCTTCGTTT CATCGGCATT 
GATCTGGCGG GAAATGTCTC GGCGGCCGCC ACCCAGGTTT ACTCGATCAA GCCCGAGCCG 
GTCGTGGACT CCGCCGCCCC CTCAATGTCC ATGTCCCTCC AGAACGGGAC CTACCTGACC 
GGGCAGCGGC TGGAGATTTC GACTGACGAG GTGGCAGCCG TCTACTACAC CACTGATGGA 
AGCACTCCGA CAACCGCCTC CTCCGAGTAT TCGTCGCCGC TCAAATTGGA AGCAAGCGCG 
GCCTACCGGT TCATTGCCGT TGACACCAGC GGCAACTCGT CCGTTCCGGT GAGCCGAAGC 
TTCGTAGTAC AAACGCCGGT GTTTGACGAC ATCGGGCCGG GAACCCAGTT CTTCGCCGAG 
ATCAGCTGGC TCGCCAAGGA AGGCATTTCA ACGGGCTGGG ACGAACGGGG CTCCCGCACA 
TACCGGCCCG TGCAGCCCGT GAACCGGGAC GCGATGGCGG CGTTCATGTA CCGGCTGGCC 
GGGTACCCGC CGTTTATCCC TCCGGCCGCA TCCCCGTTTA CTGACATCGC ACCCGGGAAC 
CAGTTCTACA AGGAAATTAC CTGGCTGGCC TCAACGGGAA TCTCCACCGG GTGGGACGAA 
GGCAACGGAC GCCGGAGCTA CCGTCCCCTG CAGCCCGTCA ACCGGGATGC GATGGCAGCC 
TTCATGTACA GGTTCGCCGG CAGCCCCGAT TTTGGCGCGT CACCCCTTTC GCAATTCACG 
GATGTCGCCG GCTCACCGTT CTACAAGGAG ATCAGCTGGT TCGCTGACAA AGGCATATCC 
ACGGGATACA CGGAACCGAA CTGGACGCGG ACCTACCGCC CGCTGAAGCC GGTCAACCGC 
GACGCCATGG CTGCTTTCAT GTACCGCCTC CACAGCGCCT TCGGCACTAA GTAG

Protein sequence

MALIKRPART RYLVVAALVA GASTLAGPAV PAQASEACVL VPNGAYTCFD RGDEGAGECP 
GGAWVGPDNV VHYGPQPERF QNWLFAPSPL IAGRPAVGRT LTVQPCNWVP DPVTLHVQWK 
RNGRAIPGAT GQSYTLTESD QGKAITVTVT GSKAAFASLA RTSAPTAVIA LAESYVDPPA 
PEIVVGNSVT SVGTRLYATN TWRYTELSYS HQWKRDGAAV DGATGEEYVL TTADIGHKMT 
VTRTGWRPGW ATVTKSSAQS DVVVAGPPPS FTLPPDTTAP VVAPSLAQGT YLYGQALSLA 
ADETADIFYT TDGSTPTQSS GRYSGPFSLD RTTELRFIGI DLAGNVSAAA TQVYSIKPEP 
VVDSAAPSMS MSLQNGTYLT GQRLEISTDE VAAVYYTTDG STPTTASSEY SSPLKLEASA 
AYRFIAVDTS GNSSVPVSRS FVVQTPVFDD IGPGTQFFAE ISWLAKEGIS TGWDERGSRT 
YRPVQPVNRD AMAAFMYRLA GYPPFIPPAA SPFTDIAPGN QFYKEITWLA STGISTGWDE 
GNGRRSYRPL QPVNRDAMAA FMYRFAGSPD FGASPLSQFT DVAGSPFYKE ISWFADKGIS 
TGYTEPNWTR TYRPLKPVNR DAMAAFMYRL HSAFGTK