Gene Rcas_4447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4447
Symbol	proA
ID	5541960
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5714901
End bp	5716172
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	64%
IMG OID	640896545
Product	gamma-glutamyl phosphate reductase
Protein accession	YP_001434481
Protein GI	156744352
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0014] Gamma-glutamyl phosphate reductase
TIGRFAM ID	[TIGR00407] gamma-glutamyl phosphate reductase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0509531
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAACC TTGAAGAGAT TGGCGCGCGC GCCCGCGCTG CCGGGAGGCG CCTGGCATTG 
ATGCCGACGG AGCGTAAGAA TGCGGCGCTC GAAGCAATTG CAGCGGCGCT GCTCGACGAA 
GCCAATGCGG CTGAGGTGCT GGCTGCCAAT GCTGATGATG TCGCCGCCGG GCGCGATGCC 
GGGCTGTCAC CTGCCCTGAT CGACAGGATG ACGCTGACGC CGCAGCGCCT TGCTGCGATT 
GCCGCCGATA CCCGCACCGT TGCCGGACTG CCCGATCCGG TGGGTGAGCG TTTCGATGCG 
ACCGTGCTGG AGAACGGACT GCGGGTGCAC AAACGTCGCG TGCCGCTCGG CGTTGTCGGC 
GTTATTTACG AGGCGCGCCC CAATGTGACG GTCGATGTCG CTGCGCTCTG CCTGAAATCG 
GGCAATGCAG CGATTCTGCG CGGCGGTAAG GAGATCACCC GATCCTGCGC GGCGCTGACG 
CGCTTGATCC AGAACGCTCT CGCGCAGACC GGGCTTCCCG CCGATGCTAT TCAGGTGATC 
GACAACCCGG ACCGCGCGCT GGTCGAGCAG TTGCTGCGCC TTGATCGCTA CGTCGATGTC 
ATTATCCCGC GCGGCGGTGC GGGGCTGCAC CGTTTCTGCC GCGAGAAGGC AAGCATCCCG 
GTGATTACCG GCGGCATTGG TGTGTGCCAC ATCTACGTCG ATCAGGCGGC TGACCTGGAG 
ATGGTCGTTC CTATCGTCCA CAACGCCAAG GTGCAACGTC CGAGCGTCTG CAACGCGCTC 
GACACGCTCC TGGTGCATCG CGCGGTCGCA GCCGAGATGT TGCCGGCGGT TGCCCGCGAT 
CTTCTCGCCA GCAACGTTGA ACTGCGCGTT GATGAAGAAG CCATGGCGCT CCTGCGCGCC 
GCAGGGTTCG ACACTCCGCA GATCGTCCCT GCACAGGAGA GCGATTTCGG CGTAGAGTTC 
ATGGCGCTGA TCCTCTCCAT TCGCGTTGTG GCGGGGCTGG ACGAGGCGCT GGAGCATATT 
GCGCGCTTCG GCGACCATTC GGACGCGATT ATCACCCGCG ATCCGGCGAC GGCGGAAGCG 
TTTGTGCAGG CGGTCGACTC GTCGGCGGTA TTCGTCAATG CTTCGACCCG CTTCAACGAT 
GGCGGGCAAC TGGGGTTAGG CGCCGAGATT GCGATCAGCA CCCAGAAACT TCATGCGCGC 
GGACCGATGG CGCTGCGTGA ACTGACTTCC TACAAATGGG TGGTGGAAGG TGATGGACAC 
GTGCGCGCCT GA

Protein sequence

MTNLEEIGAR ARAAGRRLAL MPTERKNAAL EAIAAALLDE ANAAEVLAAN ADDVAAGRDA 
GLSPALIDRM TLTPQRLAAI AADTRTVAGL PDPVGERFDA TVLENGLRVH KRRVPLGVVG 
VIYEARPNVT VDVAALCLKS GNAAILRGGK EITRSCAALT RLIQNALAQT GLPADAIQVI 
DNPDRALVEQ LLRLDRYVDV IIPRGGAGLH RFCREKASIP VITGGIGVCH IYVDQAADLE 
MVVPIVHNAK VQRPSVCNAL DTLLVHRAVA AEMLPAVARD LLASNVELRV DEEAMALLRA 
AGFDTPQIVP AQESDFGVEF MALILSIRVV AGLDEALEHI ARFGDHSDAI ITRDPATAEA 
FVQAVDSSAV FVNASTRFND GGQLGLGAEI AISTQKLHAR GPMALRELTS YKWVVEGDGH 
VRA