Gene Arth_2131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2131
Symbol
ID	4445208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2401790
End bp	2403352
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	66%
IMG OID	639689939
Product	hypothetical protein
Protein accession	YP_831611
Protein GI	116670678
COG category	[S] Function unknown
COG ID	[COG2308] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0038643
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATGT CTGACCTATT CCAGGATTAC TCCGAGGCCG CCGGCCGCTC CGGTGCCTAC 
GACGAGATGT TCACCCCCGG CCAAGAAGCC AGGAAGTCCT ACGGGCAGGT CGCCGGGGCT 
CTCCGTGAAC TTTCGCTCAC CGATGTGACC GCCCGGGCCG ATTCGATGGC CAGGACCTTC 
CTGGACCGCG GTGTCACCTT CGACTTCGCA GGGGAGGAAC GCCCGTTTCC GCTGGATATC 
GTCCCCCGCG TGATCCCGGC CGACGAATGG ACCGTCCTGG AGAAGGGCGT GGCCCAGCGG 
GTCCGCGCCC TCGAGGCCTT CCTCAACGAT GTCTACGACA AGATGTCCGT GGTGGCTGAC 
GGCGTCATTC CTCGCCAACT CGTCACCACC AGTGCCCACT TCCACCGCCA GGTCCATGGG 
TTCGAGCCGG CTGGCGGAGT CCGCGTCCAC ATCTCGGGCA TCGACGTCGT CCGTGACGCT 
GCGGGAACAT TCCGGGTGCT CGAAGACAAC GTGCGCGTCC CGTCCGGTGT CAGCTACGTC 
CTGGAAAACC GCCGGGCCAT GGCCAAGGGC CTGCCTGAGG CCTTCGGCCA GCAGCTGATC 
CGTCCGGTGG AGGAGTACCC GCGCCGGTTG CTTTCCGCCC TGCGCAAGAC GGCGCCCTCC 
GGCGTCGACG ACCCCACGGT AGTGGTCCTT ACTCCCGGCG TGTTCAACAG CGCATATTTC 
GAGCACACGC TGCTGGCCGG GCTTATGGGC GTTGAACTTG TGGAAGGCCG TGACCTGATC 
TGCCGCGGCA ACAGGGTGTA CATGCGGACC ACCGACGGCG AACAGCGCGT TGACGTCATC 
TACAAGCGGA TCGACGACGA CTTCCTCGAT CCGCTGCAGT TCCGCGCCGA CTCCATGCTG 
GGCTGCCCCG GCCTGGTGAA CGCGGCCCGG GCCGGAGGCG TCACCATCGC CAATGCCGTG 
GGCAACGGCG TGGCTGACGA CAAGCTCGTC TACAGCTATG TGCCGGACCT CATCCGCTAC 
TACCTCAACG AAGAGCCCGT GATCGCGAAC GTGGACACGT TCCGGCTGGA GGAGAAAGAG 
GCGCGGGAGC ACGTCCTGGA CAGGCTGGAT GAACTGGTGG TCAAACCGGT GGACGGGTCC 
GGCGGCAAGG GCCTGGTCAT CGGGCCCGAT GCGTCCAAAG AGGAGCTCGA CGCGCTGCGC 
AAGCGCGTCA TCGCCGATCC CCGGGGCTGG ATTGCCCAGC CGGTCCTGCA GCTGTCTACG 
GTTCCCACCC TCAGCGGTGA TAAGTTTGGC CCTCGGCACG TTGACCTGCG GCCGTTTGCC 
GTCAACGACG GCGACGACGT CTGGGTGCTA CCCGGCGGAC TGACACGCGT AGCCCTCAAG 
GAGGGTTCAC TGATCGTCAA TTCCAGCCAG GGCGGCGGTT CCAAGGACAC GTGGGTGCTC 
TCTGACTCTC CCGAGGTTCC GGTGGAAGCC CTGCCAAGGC CGTCCATCGC CGTCCGGGAA 
CGGGTTTCAG TGTGGCCGGT CGAAAGCAAC TGGCGCGACC GCCAGACGGA GCAGCAGCAG 
TGA

Protein sequence

MTMSDLFQDY SEAAGRSGAY DEMFTPGQEA RKSYGQVAGA LRELSLTDVT ARADSMARTF 
LDRGVTFDFA GEERPFPLDI VPRVIPADEW TVLEKGVAQR VRALEAFLND VYDKMSVVAD 
GVIPRQLVTT SAHFHRQVHG FEPAGGVRVH ISGIDVVRDA AGTFRVLEDN VRVPSGVSYV 
LENRRAMAKG LPEAFGQQLI RPVEEYPRRL LSALRKTAPS GVDDPTVVVL TPGVFNSAYF 
EHTLLAGLMG VELVEGRDLI CRGNRVYMRT TDGEQRVDVI YKRIDDDFLD PLQFRADSML 
GCPGLVNAAR AGGVTIANAV GNGVADDKLV YSYVPDLIRY YLNEEPVIAN VDTFRLEEKE 
AREHVLDRLD ELVVKPVDGS GGKGLVIGPD ASKEELDALR KRVIADPRGW IAQPVLQLST 
VPTLSGDKFG PRHVDLRPFA VNDGDDVWVL PGGLTRVALK EGSLIVNSSQ GGGSKDTWVL 
SDSPEVPVEA LPRPSIAVRE RVSVWPVESN WRDRQTEQQQ