Gene Arth_3140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3140
Symbol
ID	4444253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3523820
End bp	3525250
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	71%
IMG OID	639690966
Product	glycosyl hydrolase family 32 protein
Protein accession	YP_832618
Protein GI	116671685
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1621] Beta-fructosidases (levanase/invertase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCTCCC CGGACCTCGC CGCCGTCCGT TTCGACGACG TCGCCGCCCA CCACCCCGAC 
CCCGCCTTCC CGCGGTTCCA CCCGCGTCCC GCACAGGGCT GGATCAACGA CCCCAACGGC 
GTCAGCTTCA TCAACGGCCG CTACCACGTG TTCTTCCAGT ACAACCCGGA CTCCGCCCGG 
CACCACCGGA TCGCCTGGGG CCACGTCAGC TCCGCCGACC TGGTGCGCTG GGAGGAGCAC 
CCGGTGGCGC TGCGCCCGCA ACGCGGCGGC CCGGACGAGT ACGGCTGCTG GACCGGGGTG 
GTGACGGACG ACGGCGGTGT TCCCACCGCC GCGTACTCCG GCGTCCGCAG CGACGGCGGC 
CACTCAGAGG TGGTCATCGC CCGCGGTTCG GCAGACCTGG TCTACTGGGA GCAGACCGGC 
CATGTTGCGG CAACGATGCC CGCCGACGGT CAGGTGACCG CGGTGCGGGA TCCGTTCATC 
TTCAGGTTCA ACGGCAAGCG GTACGCCATG CAGGGTGCCG GCCTCGCCAA CGGGCACGCC 
GCGCTGCTCC TGTACACGGT GGAGGACTTG ACCGACTGGA AATACCAGGG CATCTGGCTG 
ACCTCGGAGA ACCCCGTGGC CTCGAAGTTC ACGCCGGCCG AGATCTGGGA GTGCCCGCAG 
CTGGTGCGCG TGCCTGAGTC TTTCGCCGCC GCGGGGGACT CGGCTGACTC GTTCGGGGAT 
TCCGGAACCT GGCTGATGAT GTTCTCGCTG TGGCTCTCCG GCGACGCACA CGAACACGCC 
AATGGTGTGG GCCACCTGAT CGGTTCGCTG ACCGAGGACC CGGTTACCGG GCTGCCCGTC 
TTCACGCCCC GGGGCGGCGG CAAGTCAGAC CACGGACGCG ACTTCTACGC TCCGCAGGTG 
GTGGCCCTGG AGGACCGGGC CCTGCTGTGG GGCTGGGCCA ACGAGGGCCC GGGCCGGGAC 
GGACGCCGCG GCCGCAGCCA GGACGACATC GACGCCGCCG GCTGGGCCGG GGTCCTGACG 
TTCCCGCGTG AGCTCTCAGT CGTGGACGGC GCCCTGGTGG TCAGCCCCGC CCCCGAAATC 
GATGCCTACC GCGGAGCGCA TACGGCCAGC CGGGCCGGAG GAACCGTCCA GCTGCCGCCG 
TTTGCCGAGG CCCTGGTGAC AGCAGGCCCG GGCGAGTCCG GCGCAGGCGG CGGGGACACC 
GCCGTCGAAC TCCTGCTTGT GGGGGACGGT ACCCGCCAGA CCGTGTTCAG CGGAACCGTC 
GAGCCGGGGG AGGAACTGCG CGTGTTCGTG GATGCCTCAC TGGTGGAGGT GTACAGGAGC 
GGTTCCGTGG CCACAACGCT CCGCGCCTAC CCGGCTGCCG GTGAAGAGTG GCAGCTGTTG 
CTTCCCGCCG GTGCGACGGC CGAGGTCTGG GAACTCGGGC AGCCTTCCTA G

Protein sequence

MPSPDLAAVR FDDVAAHHPD PAFPRFHPRP AQGWINDPNG VSFINGRYHV FFQYNPDSAR 
HHRIAWGHVS SADLVRWEEH PVALRPQRGG PDEYGCWTGV VTDDGGVPTA AYSGVRSDGG 
HSEVVIARGS ADLVYWEQTG HVAATMPADG QVTAVRDPFI FRFNGKRYAM QGAGLANGHA 
ALLLYTVEDL TDWKYQGIWL TSENPVASKF TPAEIWECPQ LVRVPESFAA AGDSADSFGD 
SGTWLMMFSL WLSGDAHEHA NGVGHLIGSL TEDPVTGLPV FTPRGGGKSD HGRDFYAPQV 
VALEDRALLW GWANEGPGRD GRRGRSQDDI DAAGWAGVLT FPRELSVVDG ALVVSPAPEI 
DAYRGAHTAS RAGGTVQLPP FAEALVTAGP GESGAGGGDT AVELLLVGDG TRQTVFSGTV 
EPGEELRVFV DASLVEVYRS GSVATTLRAY PAAGEEWQLL LPAGATAEVW ELGQPS