Gene Pnec_0162 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnec_0162
Symbol
ID	6184129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polynucleobacter necessarius subsp. necessarius STIR1
Kingdom	Bacteria
Replicon accession	NC_010531
Strand	-
Start bp	141518
End bp	143023
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	46%
IMG OID	641670886
Product	anthranilate synthase component I
Protein accession	YP_001797085
Protein GI	171462972
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.487235
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCGTG AAGAATTTAA TGCCCTAGCA AAAGAGGGCT TCAATCGTAT TCCCCTCATT 
AAAGAGGTGC TAGCAGATCT TGAAACACCT CTGCCCCTTT ACGTTAAGCT CAGCCAAGCA 
TTTGGAAAGA AGAATGCTTA CCTATTGGAG TCCGTTTTAG GCGGTGAGCG TTTCGGCCGC 
TTCTCCTTTA TTGGCCTGCC TGCCAGGACA ATCGTGAGAA CTGTTGGAAC ACCTACTGCG 
CCAATCAATG AAGTGCTTAC GGACGGAATA ATTGTTGAAA GCAATACCGA CAATCCACTC 
GACTTTGTTG ATGCTTATTT CAAACGCTTT AAGGTTGCAC TACAGCCTGA TATGCCTCGT 
TTTTGCGGCG GCCTAGCTGG TTACTTTGGT TATGACACTG TTCGTTACAT CGAATCACGT 
CTAGCCAATC ATCAACTTCC AGACGAACTT GGCATTCCTG ATATTCAACT CATGTTGACT 
GAAGAGTTGG CAGTAATTGA TAACGTTGCA GGAAAAATTT ATTTCATTGT TTATGCAGAC 
CCCAACGTTG CCGATAATTT CGAAAGGGCT CAAGAGCGCC TAAAAGAATT AATGGCTTGT 
CTTGGTAAGC CAGCAAATAT ACCAGCGTCT TTACCAAGCA CGAAAACAGA ACTCATTCGC 
AAATTTAAGG CTGCAGATTT TGAAAATGCA GTCCTTAAAA CCAAAGAATA TATTTTGGCT 
GGTGACTGCA TGCAGGTTGT GATTGGTCAA CGCATTAGCA AGCCATTCAC AGACTCGCCC 
TTAGCGCTCT ACAGAGCCTT ACGCTCTCTC AATCCATCGC CGTATATGTA TTTCTACGAC 
TTTGGCGACA TGCAAATCGT TGGTTCATCT CCCGAGATCT TGGTGCGCCA AGAAAAGCGT 
GCTGCAGAGA AAATTGTGAC GATACGTCCG CTTGCCGGAA CTCGTCCCCG TGGAGCAAAT 
CCAGAAGAAG ATGAGTGCTT GGCCAAAGAA CTCTTAGCGG ACCCCAAAGA AATCGCTGAA 
CACGTCATGC TGATTGATTT AGCCCGAAAT GACGTGGGAC GCATTGCAAA AACGGGCTCA 
GTGAAGGTAA CTGACTCCAT GTCTATCGAG AAGTACTCAC ATGTTCAACA TATTGTGAGC 
TCGGTAGAAG GTGATCTTTT AGACAACATG AGCAATATGG ACGTATTGCG AGCCACTTTC 
CCAGCGGGCA CCTTATCAGG CGCCCCAAAA ATTCGGGCAA TGGAAATCAT TGATGAGATG 
GAAATTGTGA AGCGCGGTGT ATATGGTGGC GCAGTTGGCT ATCTTTCATT CTCTGGAGAT 
ATGGATGTAG CGATTGCTAT TCGTACAGGC GTGATCCGGG ATGGCATATT GCACTCTCAG 
GCAGGTGCAG GTGTTGTAGC CGACTCTGAT CCGACTGCTG AATGGAAAGA AACAGAAGCA 
AAAGCACGCG CAGTATTGAC TACCGCAGAT CTAGTACAAG GAGGTCTTGA TGCTCCTAAT 
GATTGA

Protein sequence

MQREEFNALA KEGFNRIPLI KEVLADLETP LPLYVKLSQA FGKKNAYLLE SVLGGERFGR 
FSFIGLPART IVRTVGTPTA PINEVLTDGI IVESNTDNPL DFVDAYFKRF KVALQPDMPR 
FCGGLAGYFG YDTVRYIESR LANHQLPDEL GIPDIQLMLT EELAVIDNVA GKIYFIVYAD 
PNVADNFERA QERLKELMAC LGKPANIPAS LPSTKTELIR KFKAADFENA VLKTKEYILA 
GDCMQVVIGQ RISKPFTDSP LALYRALRSL NPSPYMYFYD FGDMQIVGSS PEILVRQEKR 
AAEKIVTIRP LAGTRPRGAN PEEDECLAKE LLADPKEIAE HVMLIDLARN DVGRIAKTGS 
VKVTDSMSIE KYSHVQHIVS SVEGDLLDNM SNMDVLRATF PAGTLSGAPK IRAMEIIDEM 
EIVKRGVYGG AVGYLSFSGD MDVAIAIRTG VIRDGILHSQ AGAGVVADSD PTAEWKETEA 
KARAVLTTAD LVQGGLDAPN D