Gene Francci3_3175 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3175
Symbol	argC
ID	3903900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3762643
End bp	3763671
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	74%
IMG OID	637880499
Product	N-acetyl-gamma-glutamyl-phosphate reductase
Protein accession	YP_482261
Protein GI	86741861
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0002] Acetylglutamate semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01850] N-acetyl-gamma-glutamyl-phosphate reductase, common form

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.461089
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.232638
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGTGA CGGTAGCAGT TGCGGGGGCG AGTGGGTACG GCGGCGGAGA GCTGCTGCGC 
CTGCTCCTCG CCCATCCCGA AATCAAGATC GGTGCGCTGG CCGCGAACGC GTCCGCCGGC 
CTGCCGGTGA CGGAGGTGCA TCCCCACCTG CCCGACCTGG AGGGCCGGGT GTTCACGGAC 
GCGGCCGCGC TGGCCGGGAC CGACGCGGAC ATCGTTTTCC TGGCGCTGCC GCACGGTCAG 
TCGGCCGCGG TGGCGGCCAC CCTGCCCGAC ACCGTGCGGG TCGCCGATCT GGGTGCCGAT 
CATCGGCTCG TCGACCCGGA GGCGTGGCGG CGCGCCTACG GGGGGGAGCA CGCCGGGACC 
TGGACCTACG GCCTGCCCGA GCTCCCCTGG GCACGGGCGG AGATCGCCGC GAGCCGGCGA 
GTGGCGATTC CGGGCTGCTA TCCCACGGCG ACCTCTCTCG GGCTCGTGCC GCTGCTGGTC 
GGCGGCCTCG TGGAGCCCGC CGACCTGGTC GTTGTCGCGG CGAGCGGCAC GTCCGGCGCG 
GGGCGCTCGG CCACGGTGAA CCTGCTCGGC AGCGAGGTGA TGGGTGACCT GACCGCCTAC 
AAGGTGGGCA CCCACCAGCA CAGACCCGAG ATCACGCAGA CCCTCTCCCG GGCCGCCGGT 
ATGACCGTGA CGGTGTCCTT CACCCCGGTG CTCGCCCCGC TTCCCCGCGG CATCCTCGCG 
ACCAGCACCG GCCGGGCCAC CCCGGGCACC GACGCGGACG CCGTGTACGA GACGCTGCGG 
GCCGCCTACG CGGGGGAGCC GTTCGTCCGG GTGCTGCCGC CGGGGCGCTG GCCGCACACC 
GCGGCGACGC TCGGCGGGAA CGCCGTTCAT GTGCAAGGGA CCTTCGACCC GGAGACCGGC 
CGGGCGATCG TCGTCACCGC GATCGACAAC CTCGGCAAGG GCGCGGCCGG CCAGGCGCTG 
CAGTGCGCCA ACCTGATGCT CGGCCTGCCC GAGACCGCCG GGCTGACCGC TCAGGGCATC 
GCCCCCTGA

Protein sequence

MGVTVAVAGA SGYGGGELLR LLLAHPEIKI GALAANASAG LPVTEVHPHL PDLEGRVFTD 
AAALAGTDAD IVFLALPHGQ SAAVAATLPD TVRVADLGAD HRLVDPEAWR RAYGGEHAGT 
WTYGLPELPW ARAEIAASRR VAIPGCYPTA TSLGLVPLLV GGLVEPADLV VVAASGTSGA 
GRSATVNLLG SEVMGDLTAY KVGTHQHRPE ITQTLSRAAG MTVTVSFTPV LAPLPRGILA 
TSTGRATPGT DADAVYETLR AAYAGEPFVR VLPPGRWPHT AATLGGNAVH VQGTFDPETG 
RAIVVTAIDN LGKGAAGQAL QCANLMLGLP ETAGLTAQGI AP