Gene Pnec_1200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnec_1200
Symbol
ID	6184003
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polynucleobacter necessarius subsp. necessarius STIR1
Kingdom	Bacteria
Replicon accession	NC_010531
Strand	-
Start bp	1037451
End bp	1038416
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	49%
IMG OID	641671783
Product	porphobilinogen deaminase
Protein accession	YP_001797959
Protein GI	171463846
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0181] Porphobilinogen deaminase
TIGRFAM ID	[TIGR00212] porphobilinogen deaminase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.580193
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	0.533215
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCAAA CCCTGAATTC TTCTCCCCAA TCCGCCCCCA AACGCCTAGT AATTGCCTCC 
CGTGAAAGTC GTTTGGCCAT GTGGCAGGCT GAGCACGTCC AAGATTGCCT TAAAAAGCTC 
TATCCGGACT GTGATGTCCA AATCTTGGGG ATGACTACTC GCGGTGACCA AATATTGGAT 
AGAGCCCTCT CAAAAGTGGG TGGTAAAGGC CTTTTTGTAA AAGAGCTTGA AACAGCCCTT 
GAGGATGGTC GGGCTGATTT AGCAGTGCAT TCCTTAAAAG ATGTCCCCAT GGTGATGCCA 
GAGGGGTTTG ATCTTGCCTG CGTCATGGCC AGAGAGGATG CAAGGGATGC GTTTGTTTCA 
AATGATTACG CTAGCCTTGA GGATCTTCCG ATCGGAGCAA TTGTGGGTAC CTCTAGCTTG 
CGACGGGAAT CGGTTTTGCG TGCCAAGTTT CCTCATCTCG TGATTCAGCC TTTACGCGGT 
AATTTGGATA CCCGTATGGG TAAATTGGAT AAAGGTGAGT ACCAGGCGAT TATTTTGGCT 
GCTGCTGGTT TAAAGCGCTT AGGTTTAGAG TCACGCATAC GAGCATTCTT GCCATACGAT 
CCTTATACGC CAGCTGCAGG GCAGGGCGCC CTAGGAATCG AAACCTTGAG TAAACATCCC 
AATATTAAGC AATGGCTCGC GCCATTAAAT GATTTGCCTA CATTGTTCGC TGTTTCAGCT 
GAACGCATGG TGTCACGTCA GCTAGGAGGG TCTTGTGAAG TGCCGCTCGC TGCACACGCT 
GTACGGGATC AAAATCAAAT GCAGATTCGC TCTTTTGTTG CGAGCACTGA TGGCAAAGCA 
ATTTGCTTGG CTCATGGCAG CGCATTAGTT GAGTCGGTCG AAGATGCAGA AGCATTGGGT 
CTTGCGGTCG CGCAAGATTT GCTCTCACAG GGCGCGGCAG ATTTAATTCC TGCACTACCA 
AAATAA

Protein sequence

MSQTLNSSPQ SAPKRLVIAS RESRLAMWQA EHVQDCLKKL YPDCDVQILG MTTRGDQILD 
RALSKVGGKG LFVKELETAL EDGRADLAVH SLKDVPMVMP EGFDLACVMA REDARDAFVS 
NDYASLEDLP IGAIVGTSSL RRESVLRAKF PHLVIQPLRG NLDTRMGKLD KGEYQAIILA 
AAGLKRLGLE SRIRAFLPYD PYTPAAGQGA LGIETLSKHP NIKQWLAPLN DLPTLFAVSA 
ERMVSRQLGG SCEVPLAAHA VRDQNQMQIR SFVASTDGKA ICLAHGSALV ESVEDAEALG 
LAVAQDLLSQ GAADLIPALP K