Gene Arth_2011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2011
Symbol
ID	4445455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2266480
End bp	2267619
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	69%
IMG OID	639689819
Product	hypothetical protein
Protein accession	YP_831491
Protein GI	116670558
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3616] Predicted amino acid aldolase or racemase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.51846
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGTATC CGCAGCTCAG GCTTAATGCC GATGCTCTCG AAAACAATAT CCGCGTCATG 
GCGTCCTGGT GCCGGGAACG TCAGGTGGAC CTTGCCCCGC ATGTCAAGAC CACCATGTCT 
GCACCGATCA TCAGCCGCCA GATGGCAGCC GGGGCCGTGG GGGTAACGGT CGCCACAGTG 
GACCAGGTCG CTTCTGCGCT GGGCTGGGGA CACCGGCACG TCCTCATCGC CAACGAGGTC 
GTCGACCGGT ACGGCCTGGC ACGGATCCGC GGCTGGCTGG GGGAGGACTC CGGACGCGAA 
ATCCGCTGCT TCGTGGACTC CGCTGCCGGT GTCAACGCCG CCGCCGAGGT ATTCGGCGCC 
GAGGGGGTGG CCCTCGAGGT GCTGATCGAC GTCGGGACGC CGGGCGGACG CACGGGAGTC 
CGCAGCCTCC AGGAGGCGGT TAAGCTTGCC GGGCTGGTCC ATGCGGCGCC CGGCCTCAGG 
CTCGTTGGAG TCGCCGGGTA CGAAGGCGTC GTGCCCAACA GCAGGGCAGA AGGGACGGTC 
GCGGCCGTTG ACCGGCACTG CCGGCTGGTG CGGGATGTCT ACCTGGAAGT CGCGCCGTGG 
TTTGAAACGT CAGCCCCGGT CTACTCGATG GGCGGGTCCG CTTTCCCGGA CCGCGTGGCG 
GAATACCTCC CGGACGGCGG CCAGGTGCCC GGAACAAGGC GGGTCCTCCG TTCGGGTTGC 
TACGTCACCC ACGACCACGG CACGTACGCC GGCGTCAGTC CGGTGCCCGG ACTGGCGCCG 
GCGCTGACAG TCCGCGCCGT TGTGCTCTCC ACCCCCGAAG ACGGGATCGC CGTCGTCGGT 
GCCGGCAAGC GGGACCTGCC CTACGACGCC GGATTGCCGG TGGTCCTGTC GGTCCACACC 
GCTGACGGCA CCCCGAGGGC CGGGGCGGCC GCCGTTGTGC GCAACCTCTT CGACCATCAC 
ACCGTCCTCA CCGGGGTGAA CGGACTGGAG GTCACGGATG TGGTGGACTT CGGGATATCC 
CACCCCTGCT CCGCGTTCGA CCGCTGGCCC GAATACGTCG TCACCGACGG CACCGGACGG 
GACGTGGATG TGTGGCACAC GGATTTCCAC CGGTCTTCGC TGGTGGCGCC AAAACGGTGA

Protein sequence

MPYPQLRLNA DALENNIRVM ASWCRERQVD LAPHVKTTMS APIISRQMAA GAVGVTVATV 
DQVASALGWG HRHVLIANEV VDRYGLARIR GWLGEDSGRE IRCFVDSAAG VNAAAEVFGA 
EGVALEVLID VGTPGGRTGV RSLQEAVKLA GLVHAAPGLR LVGVAGYEGV VPNSRAEGTV 
AAVDRHCRLV RDVYLEVAPW FETSAPVYSM GGSAFPDRVA EYLPDGGQVP GTRRVLRSGC 
YVTHDHGTYA GVSPVPGLAP ALTVRAVVLS TPEDGIAVVG AGKRDLPYDA GLPVVLSVHT 
ADGTPRAGAA AVVRNLFDHH TVLTGVNGLE VTDVVDFGIS HPCSAFDRWP EYVVTDGTGR 
DVDVWHTDFH RSSLVAPKR