Gene Arth_1855 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1855
Symbol
ID	4445614
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2086818
End bp	2088032
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	66%
IMG OID	639689670
Product	glycosy hydrolase family protein
Protein accession	YP_831342
Protein GI	116670409
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.244626
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGCCA CCGCAACCTC CGCCCCGGCG CACGCACCCG CCGTGCTGCC CACGATGCTG 
CCCCTCACGC TGCCGACAGG CTACGAAGTC CCCGCAGAGT TCGCCGATGC CGCCTCCAAG 
GCATGGAAGA CCGCCTCGGC GAAACTGAAC GGACTGATCA TCAGGCACCC GGACCGGTTC 
CCGCTCTACA CAGAGGAAGG CAAATGGGTG GTCGACGGCG AAGCCTGGAC CAACTGGTGC 
GAAGGCTTCC TTGGGGGTCA GCTGTGGATG CTTTCCCGCC GGGCCGACGA GGCCGATCGC 
GCCCGCTTTC GTAGCGCGGC CGAGCACTAC TCCGAGCTCA TCGAAGAACG CAAGAGCGAC 
GACACCGTCC ACGACCTGGG CTTCTTGTTC TGGTCCACTT TCCGGCGTTG GTTCGAAGCA 
ACAGGTGACA CCACCAAGCG CGACGTCGTC ATCGAGGCCG GACGCACCAC TGCCAGCCGC 
TACCGGGAAG CCGGCCGGTA CATGCCCAGC TTCCGCCAGC CCGACAGCCT GTTCATCGAC 
ATCATGATGA ACATCCACAT GGCCCTCTAC GCCGCGCAGC AGACCGGAGA CCAGGACATG 
GCCCGCAAAG CCGTAGACCA CTGCCTCACC ACCCGCCGGT TCCTCATGCG CGGCGACGGC 
TCGGCCTCCC ACGAAGGCAT TTTCGATCTG GAAACCGGCT CCTTCCTGAA GCAGACCACT 
CAGCAGGGCT TCGCCGACGA CGGATCCTGG GCCCGCGGGC AGGCCTGGGC GCTCTACGGC 
TTCGGTACCG TCTACCGCTT CACCGGCGAA CGGCGCTTCC TCGAAACCGC CATCGCCGCC 
GCGGACTTCT ACCTCGAAAA GACCGGCGAC TGTCTCGTCC CACCGAACGA CTGGGACGAA 
CCCAACCCCG TCCGGCCCTA CGAAACATCG GCTGCGGCCG CCGCGGCCGG CGGCTTCTGG 
CAGCTCGCCG GCCTCATCCA GGACCGCACC AAAGCGCAGG TCTATGCCGA TTACGCGGTG 
GCCATCATCG GCCGCCTAAC CGAGGACGAT TTCCTGGCCG GGCCGAGCGA GGACTGGGAG 
GGCGTGCTCA AACACGGCAG CTACCACGAA GGAAAGGGTC TGGGCGTCGA CGAGTCGGTG 
ATGTGGGGCG ATTACTGGTT CCTGGACACC ATGGACCAGA TCCAGCAGTA CGCCGAAGCC 
CAGAGAGGCC GGTGA

Protein sequence

MTATATSAPA HAPAVLPTML PLTLPTGYEV PAEFADAASK AWKTASAKLN GLIIRHPDRF 
PLYTEEGKWV VDGEAWTNWC EGFLGGQLWM LSRRADEADR ARFRSAAEHY SELIEERKSD 
DTVHDLGFLF WSTFRRWFEA TGDTTKRDVV IEAGRTTASR YREAGRYMPS FRQPDSLFID 
IMMNIHMALY AAQQTGDQDM ARKAVDHCLT TRRFLMRGDG SASHEGIFDL ETGSFLKQTT 
QQGFADDGSW ARGQAWALYG FGTVYRFTGE RRFLETAIAA ADFYLEKTGD CLVPPNDWDE 
PNPVRPYETS AAAAAAGGFW QLAGLIQDRT KAQVYADYAV AIIGRLTEDD FLAGPSEDWE 
GVLKHGSYHE GKGLGVDESV MWGDYWFLDT MDQIQQYAEA QRGR