Gene Arth_3406 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3406
Symbol
ID	4444136
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3831303
End bp	3832643
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	69%
IMG OID	639691230
Product	phosphoribosylamine--glycine ligase
Protein accession	YP_832881
Protein GI	116671948
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0151] Phosphoribosylamine-glycine ligase
TIGRFAM ID	[TIGR00877] phosphoribosylamine--glycine ligase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCACAAAG TACCCTTGGA GACTGTGAAG GTACTCGTCA TTGGCCCTGG TGGCCGCGAA 
CACGCCATTG TCCGCTCCCT GCTTGCAGAC CCCAACGTTT CCGAAGTCCA TGCGGCTCCG 
GGCAACGCGG GTATCGGCAA GCTGGTCCCC ACCTACGCCA TTGACGGCAA TGATCCGGAC 
GCCGTAGCGG CCCTGGCCAC CAAGCTGGGT GTGGACCTCG TGGTGGTTGG TCCCGAGGCG 
CCCCTGGCCG CCGGGGTTTC CGATGCCGTC CGTGCAGCCG GGATCCCCGT CTTCGGACCC 
AGCAAGGCGG CCGCCCAGCT GGAGGCCTCC AAGGCATTCG CCAAGCAGGT CATGGCCGAG 
GCCGGCGTTC CCACCGCCAT GGCGCGCGTT GCGAGCACCG CCGAGGAAGC TGCCGACGCG 
CTGGACACCT TCGGCGCCCC CTACGTGGTC AAGGACGACG GCCTGGCCGC CGGCAAGGGC 
GTGGTGGTTA CCAACAACCG GGACGAAGCC CTGGCCCACG CCCAGAGCTG CTTCGACGCG 
GGCGGCTCCG TGGTGATCGA AGAGTTCCTG GACGGTCCCG AGGTTTCCGT GTTCGTCCTG 
TGCGACGGCC GGAACACGGT GGCACTCTCC CCGGCGCAGG ACTTCAAGCG CATCTTCGAC 
AACGACGAAG GCCCCAACAC CGGCGGCATG GGCGCCTACA CCCCGCTGGA GTGGGCGCCC 
GAAGGCCTGG TCCAGGAAGT CATCGACCGC GTGGCGCAGC CCACGGTCAA CGAGATGGCG 
CACCGCGGAA CCCCGTTCGT CGGCGTGCTG TTCGTGGGCC TGGCCCTGAC CTCGCGCGGC 
ACCCGCGTCA TCGAATTCAA CGTCCGCTTC GGCGATCCGG AAACCCAGGC CGTCCTGGCC 
CGGCTCAAGA CGCCGCTCGG TGCGCTGCTG CTGGCAGCTG CCAAGGGCGA ACTGGACAAA 
GCGGAAGAGC TGCGCTGGTC CAAGGACACC GCGGTCGCCG TCGTCGTCGC CTCGGAAAAC 
TACCCGGACA CCCCGCGAAC GGGTGACCGC ATCCGCGGCC TCAAGAAGGT GGACGAGCTG 
GAAGGCGTCC ACGTGATCCA CGCCGGCACC AAGCTGGACG AGGAAGGCAA AGTGGTCTCC 
GCCGGCGGCC GCGTGCTCGC CGTGGTCGCG CTGGGAACCG ACCTCGTGGA GGCCCGGGAA 
CGCGCGTACG ACGGCGTGGA GCTGGTACAG CTCGAAGGCG GGCAGTTCCG CACCGACATC 
GGGCGCAAGG CGGCCCGCGG CGAAATCAAG GTCTCGGCCC CGTCCACCGG AACGCTGCCC 
GTAACGAAGG CGAAGGCATA G

Protein sequence

MHKVPLETVK VLVIGPGGRE HAIVRSLLAD PNVSEVHAAP GNAGIGKLVP TYAIDGNDPD 
AVAALATKLG VDLVVVGPEA PLAAGVSDAV RAAGIPVFGP SKAAAQLEAS KAFAKQVMAE 
AGVPTAMARV ASTAEEAADA LDTFGAPYVV KDDGLAAGKG VVVTNNRDEA LAHAQSCFDA 
GGSVVIEEFL DGPEVSVFVL CDGRNTVALS PAQDFKRIFD NDEGPNTGGM GAYTPLEWAP 
EGLVQEVIDR VAQPTVNEMA HRGTPFVGVL FVGLALTSRG TRVIEFNVRF GDPETQAVLA 
RLKTPLGALL LAAAKGELDK AEELRWSKDT AVAVVVASEN YPDTPRTGDR IRGLKKVDEL 
EGVHVIHAGT KLDEEGKVVS AGGRVLAVVA LGTDLVEARE RAYDGVELVQ LEGGQFRTDI 
GRKAARGEIK VSAPSTGTLP VTKAKA