Gene Arth_2653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2653
Symbol
ID	4444774
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2976836
End bp	2978218
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	69%
IMG OID	639690473
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_832132
Protein GI	116671199
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000365317
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGGCA CCGCCCCCAC CGAGTCAGCT ACTTCAGGAC CCGTTGCCGA CGTGCCGCAC 
TGGCCGGCAC CGTTCGCCGA AGCGCCCGTC GACGCCACGG TCACCGTCCC GGGCTCCAAG 
TCCCTCACCA ACAGGTATCT GGTTCTTGCG GCCCTGGCCG ATGGGCCGTC CCGTCTGCGG 
GCACCCCTGC ATTCGCGCGA CTCGGCCCTC ATGATCGAGG CCCTCCGGCA ACTGGGAGCC 
GGTATCAGGG AAGTTCATAG CGACGGCGCG TTCGGGCCCG ACCTTGAGGT CACCCCCCTC 
CGTGCCGACG CCGCGGCGAC CGATGCCGCC ATCGACTGCG GACTCGCCGG AACAGTCATG 
CGCTTTGTTC CGCCGGTGGC TGCGCTCCGC AACGGGGCGA CAGTCTTCGA CGGCGATCCG 
CACGCCCGCA AGCGGCCGAT GGGCACCATC ATCGAGGCAC TGGCCGCCCT CGGCGTCGAC 
GTCCGCGCTG CGGACGGGAC CCCGCCGTCG GCTCTTCCCT TCACAGTGGC GGGCAGTGGC 
CACGTACGGG GCGGCCATCT GGTGATCGAC GCAAGCGCCT CTTCGCAGTT CGTGTCGGCG 
CTGCTCCTGG TGGGCGCGCG TTTCACCGAG GGCCTGCACC TTGAGCACGT GGGCAAGCCG 
GTCCCCAGCC TGGACCACAT CAACATGACC GTCGCCGTGC TGAGGGAAGT CGGCGTGTCC 
GTCGACGATT CCGTCCCGAA TCACTGGGTT GTAGCGCCGG GCCGCATCCG GGCCTTCGAT 
CGCCGCATCG AGCAGGACCT GTCGAATGCC GGGCCGTTCC TCGCCGCCGC GCTGGCGACC 
CGCGGCACGG TCCGCATTCC CAACTGGCCC TCCCCCACCA CGCAGGTCGG CGACCTTTGG 
CGCAGCATCC TGACCGCGAT GGGCGCCACG GTCACGCTGG ACAACGGCAC ACTCACCGTC 
ACGGGCGGCC CCGAAATCAC GGGGGCGGAC TTTGCCGACA CCAGCGAACT TGCACCGACA 
GTGGCCGCGC TGTGCGCACT GGCCACGGGT CCGTCGCGGC TGACCGGCAT CGCGCACCTC 
CGCGGCCACG AAACGGACAG GCTAGCCGCA CTCGTCACGG AGATCAACCG CCTCGGCGGC 
GATGCCGAGG AAACTTCCGA CGGCCTGGTG ATCCGGCCCG CGAAGCTCCA TGGCGGCGTC 
GTGCACAGCT ACGCGGACCA CCGCATGGCC ACCGCAGGGG CCATCCTGGG CCTCGCCGTT 
CCCGGCGTGG AAGTGGAAGA CATCGGCACT ACGTCCAAGA CCATGCCGGA CTTTCCGCAA 
CTTTGGGAAT CCATGCTGAC ACAACAGCCG GGCCGGCAGA CGGAACAGGC CCGTGGGGCG 
TAG

Protein sequence

MTGTAPTESA TSGPVADVPH WPAPFAEAPV DATVTVPGSK SLTNRYLVLA ALADGPSRLR 
APLHSRDSAL MIEALRQLGA GIREVHSDGA FGPDLEVTPL RADAAATDAA IDCGLAGTVM 
RFVPPVAALR NGATVFDGDP HARKRPMGTI IEALAALGVD VRAADGTPPS ALPFTVAGSG 
HVRGGHLVID ASASSQFVSA LLLVGARFTE GLHLEHVGKP VPSLDHINMT VAVLREVGVS 
VDDSVPNHWV VAPGRIRAFD RRIEQDLSNA GPFLAAALAT RGTVRIPNWP SPTTQVGDLW 
RSILTAMGAT VTLDNGTLTV TGGPEITGAD FADTSELAPT VAALCALATG PSRLTGIAHL 
RGHETDRLAA LVTEINRLGG DAEETSDGLV IRPAKLHGGV VHSYADHRMA TAGAILGLAV 
PGVEVEDIGT TSKTMPDFPQ LWESMLTQQP GRQTEQARGA