Gene Arth_0405 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0405
Symbol
ID	4447100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	435509
End bp	437077
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	65%
IMG OID	639688204
Product	levansucrase
Protein accession	YP_829906
Protein GI	116668973
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGCGGT GGCGCCCCGC CGCCGCAGCA CTGGCGGCGG CCGTGGCGGC TTCCGCCTTC 
CTTGCCGTTC CGTCGGCCCA GGCCAACGAA CCTTCGGACC CGCCCGCCAC CCAGCAGATG 
CCGGCACCCA CCCCCGGCTT CCCGCTGCCC ACCGACCACA GCCAGAAGGC CTACGATCCG 
GCGGCGGACT TCACCTCAAA GTGGACCCGC GCCGATGCCA AGCAGATCAT GGCCCAGAGC 
GACTCCACCG TGGCTCCCGG CCAGAACTCC ATGAGCCCGG ATGTCACCAT GCCGGAAATC 
CCTGAGGATT TCCCCGCGAT GAACGACGAC GTCTGGGTCT GGGACACGTG GTCCCTGACC 
GACGAAAACG CCAACCAGAT CAGCTACAAG GGCTGGGACG TCATCTTCTC CCTCGTCGCT 
GACCGCCACG CCGGCTACGG CTTCGACCAG CGCCACTGGA ACGCCCGGAT CGGCTACTTC 
TTCCGCAAGA CCAACGCCGA CCCGGCCAAG GACAAGTGGA ACTACGGCGG ACACGTCTTC 
GCTGACGGCG CTTCCATCGG CAACACCGAA TGGTCCGGCT CCACCCGCCT GATGCAGGGC 
AACCAGGTCA ATGTGTTCTA CACGGCCACC ACGTTCTACG ACGTTGCCGA ACGCAATGCA 
GGCGGCGGCG GCATCGCACC GGACGCGGCC ATCGCCAAGG CGCTGGGCAA GATCCACGCC 
GACCAGAACG GTGTCACGTT CGACGGCTTC AAGCACACCA AGCTGCTGGA GCCGGACGGC 
AAGATGTACC AGAACAAGGC CCAGAACCCG GGCTTCGCCT TCCGCGACCC GTACACGTTC 
GCCGACCCCG CACACCCGGG CAAGACCTTC ATGGTCTTCG AAGGCAACAC CGGCGGCACC 
CGCGGCGAAT ACGAGTGCAA GCCCGAGGAC CTTGGCTACA AGGCCGGCGA CCCCAACGCT 
GAGAACCTCA ACGAGGTCAA CAGCAGCGGC GCCTACTACC AGACCGCCAA CGTGGGGCTG 
GCAGTGGCGG ACAACAAGGA TCTGACCAAG TGGTCCTTCC TGCCGCCGAT CCTTTCGGCC 
AACTGCGTCA ACGACCAGAC CGAGCGTCCC CAGATCTTCA TCCAGAATGA AGGCGGCAAG 
AACAAGTACT ACCTGTTCAC CATCAGCCAC CAGTTCACCT ACGCGGCCGG CATGCGCGGC 
CCCGACGGCG TCTATGGCTT CGTGGGCGAC GGTGTCCGTT CGGACTACCA GCCGATGAAC 
AACAGCGGCC TGGCCCTGGG CTCGCCGACG GACCTGAACC TTCCGTCCGA GTCCCCCGAG 
GCACCCACCC CGAACCAGAA CGGCCGCCAG TTCCAGGCCT ACTCGCACTA CGTGCAGCCG 
GGCGGCCTGG TGCAGTCCTT CATTGACAAC GTGAACGGCG TCCGCGGCGG CTCACTCTCG 
CCCACCGTGA AGATCAACTT CCGTGACGGC GTATCCCAGG TGGACCGCAC CTTCGGCAAG 
AACGGCCTCG GCCCGTTCGG CTACCTGCCC ACCAACCTCA AGGTTGGCGG CGAGGGCCTC 
TACAAGTAA

Protein sequence

MLRWRPAAAA LAAAVAASAF LAVPSAQANE PSDPPATQQM PAPTPGFPLP TDHSQKAYDP 
AADFTSKWTR ADAKQIMAQS DSTVAPGQNS MSPDVTMPEI PEDFPAMNDD VWVWDTWSLT 
DENANQISYK GWDVIFSLVA DRHAGYGFDQ RHWNARIGYF FRKTNADPAK DKWNYGGHVF 
ADGASIGNTE WSGSTRLMQG NQVNVFYTAT TFYDVAERNA GGGGIAPDAA IAKALGKIHA 
DQNGVTFDGF KHTKLLEPDG KMYQNKAQNP GFAFRDPYTF ADPAHPGKTF MVFEGNTGGT 
RGEYECKPED LGYKAGDPNA ENLNEVNSSG AYYQTANVGL AVADNKDLTK WSFLPPILSA 
NCVNDQTERP QIFIQNEGGK NKYYLFTISH QFTYAAGMRG PDGVYGFVGD GVRSDYQPMN 
NSGLALGSPT DLNLPSESPE APTPNQNGRQ FQAYSHYVQP GGLVQSFIDN VNGVRGGSLS 
PTVKINFRDG VSQVDRTFGK NGLGPFGYLP TNLKVGGEGL YK