Gene Acid345_4161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4161
Symbol
ID	4072120
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4927572
End bp	4928624
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	61%
IMG OID	637986192
Product	N-acetyl-gamma-glutamyl-phosphate reductase
Protein accession	YP_593235
Protein GI	94971187
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0002] Acetylglutamate semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01850] N-acetyl-gamma-glutamyl-phosphate reductase, common form

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0034393
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.156047
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGCTG CTGTCCAGTC CGCCGTTCTC GGCGCTACCG GCTATTCCGG CTATGAGTTG 
ACCAAGCGGT TGCTCGCGCA TCCGTCCGTC AAGCAGCCTG CGCTCTTCCG CGTGAATCCC 
GATCCCACGC AGTCGCCGAA CCTTGCCGAC TGGTACCCGC AGCTCTCCGG CAACGGCTAC 
GGCCAGCTCG TGATGGACGC ATTCTCGTGG GACGCACTCA AGGCCAAAGG CACGGACGTC 
ATCTTCTTCT GCACCCCGCA CGAAGTCTCC CGCGAACTCG CGATCGAAGC GGGCGACCGC 
GGCTTTCGCG TCGTGGACCT CAGCGGCGCG TGGCGTTTGA AGGAAGCAAC TAACCGTGCC 
GTGTACAAGT TCGAAGATCA TGACCCGGCT CAAGCAGCCC TGCTCGACCA GCAGGCCGTC 
TACGGCAGCC CCGAATTGCA TAAATATGCA ATCGAAAAAG CAGAGCTCGT CGCCAACCCT 
GGCTGCTATG CGACCTCGAT CATCCTCGCT CTTGCGGCCT GGACCAACGA CGGCTTGATC 
GACCTCGAAT TCGGAGTAAT CTGCGACTCC AAGTCCGGCG TCAGTGGCGC CGGCAAGGCA 
CCGAGTCCGA CGACTCACTT CGTAGAAGTC GCCGACAGCC TCTCCGCCTA CAGCGTTTTC 
GGCCATCGCC ACACCGGAGA AATGCTCGAG CAGCTCGGTC TCGAAGCTTC GCAGCTTCAG 
TTCACGCCGC ACTTGCTGCC GATTCCGCGC GGCATTCTCT CGACGATCTA CGTTCGCCCG 
AAGACTGGCG TTACCGCCGA GGTCCTCGAG TACAGCCTGA AAGAATTCGC CGTCGGTAAG 
CCCTTCGTGC GCGTCTTCGC GCCCGGCAAG CTGCCGCAGA TCAAGTACTC GCTGCACACC 
AACTACTGCG ATATCGGCTT CCAGCTCTCG CCCGACGGCT CGCGCGCAGT CCTCGTCTCT 
TGTCTTGACA ACCTAGTCAA AGGCGCAGCC GGACAGGCGA TCCAGAACAT GAACCTGATG 
TTCGGCTTCG ACGAACGAGA GGGCCTGCAA TGA

Protein sequence

MSAAVQSAVL GATGYSGYEL TKRLLAHPSV KQPALFRVNP DPTQSPNLAD WYPQLSGNGY 
GQLVMDAFSW DALKAKGTDV IFFCTPHEVS RELAIEAGDR GFRVVDLSGA WRLKEATNRA 
VYKFEDHDPA QAALLDQQAV YGSPELHKYA IEKAELVANP GCYATSIILA LAAWTNDGLI 
DLEFGVICDS KSGVSGAGKA PSPTTHFVEV ADSLSAYSVF GHRHTGEMLE QLGLEASQLQ 
FTPHLLPIPR GILSTIYVRP KTGVTAEVLE YSLKEFAVGK PFVRVFAPGK LPQIKYSLHT 
NYCDIGFQLS PDGSRAVLVS CLDNLVKGAA GQAIQNMNLM FGFDEREGLQ