Gene Pnec_1104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnec_1104
Symbol
ID	6183353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polynucleobacter necessarius subsp. necessarius STIR1
Kingdom	Bacteria
Replicon accession	NC_010531
Strand	-
Start bp	964548
End bp	966416
Gene Length	1869 bp
Protein Length	622 aa
Translation table	11
GC content	46%
IMG OID	641671714
Product	extracellular solute-binding protein family 5
Protein accession	YP_001797891
Protein GI	171463778
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTACCC GAACACTTAT TCGCCAATTT GCCCATTTTT TGCTGCTAGC TCTGCTAGGG 
GCGCTTGGGG CCAATACAAC TATGGCGGGG CAGGGAATTG CGCAATACGG CATACCGAAG 
TATTCCGACG GATTTGCTCA TTTTGATTAC GTTAATCCGA ACGCTCCCCG TGGGGGAACC 
TTGGTCTTGC CAAATCCAGG CCAAAGAACC AGTTTCGATA AATTCAATCC GTTTACTCTG 
CGTGGCATTA CTGCTCCGGG CATTGATCTG ATGTTTGAAT CATTGGCTGA GGGTAGTGCT 
GATGAGGTTT CGAGTATTTA CGGGTTATTG GCGGATGATA TTCAAGTAGC TAAAGATCGT 
AAGTCGGTTA CTTTCCACAT CCGCCCAGAA GCAAAATTTT CTGATGGCAG TCCTGTTTTG 
GCTACAGATG TTAAATATAG TTTTGACACT CTTATGAGTG GCAAGGCACA CCCTCGCTAT 
AAGACTACTT TTGCTGATAT TAAAGAAGCG GTAGTTTTAT CGGATCAATC CATTCGCTTT 
GATTTTAAGA ATGACAATGC GGAGCTGCCA ATTTTGGCTG GCACCTTTCC GGTCTTCTCG 
CGCAACTGGG GTAAGCAGCC CGATGGATCA ATAATTCCAT TCGAAAAGCT TGCCTTTGAT 
GCACCGCTTG CAAGTGGCCC TTATTTGATT GAGTCTTTTA AAGCGGGTAA GTCGATTGTT 
TATAAAAAGA ACCTAAACTA TTGGGCTGAT CAACTGAGCA GGCCTCTGAA TGTGCGTGTC 
GGTTTTTATA ACTTTGATCG TGTGTTGTAC AAGCTGTATA GCGATGATGC TGTTCGGTTG 
GAAGCTTTTA AGGCTGGGGA GTTTGATGCT CTGGTGGAGT ATCGCGCCAA GATCTGGGCT 
AAGGGCTATG TCGGATCTAA GTTTGATAAG GGCATCTTAT TAAAGAAGGC ATTCCTCAAT 
CATAATGGCG CTGGCATGCA AGGTTTTGCC ATGAATGTAC GGCGCCCAAT ATTCAAAGAT 
GCGCGTGTGC GTGAAGCTCT GGGATATGCG CTAGATTTTG AGTGGCTTAA TCGTCAAATA 
TTCTTTGATC AATACAGTCG TATTAATAGC TATTTTACGA ATAGCGACTT AAGTGCTAAT 
TTTGATGGCC CACACAAACC AACCGAAGGC GAGTTGAAAT TACTCAAGCC TTTAAAAGCA 
AAATATCCTC AGTGGGTTCC AGATGCCGTT TTTGGTCCAA TGCCTGCAGC ACTTTCAACC 
AAGCCACCTG GAAGTTTGCG CCAGAATTTA AAGAAAGCGC GCGAGCTCCT TATGCATGCA 
GGTTGGCAAT ACCGTGATGG CGCATTGCGT AACGAAAAGG GCGAGCCATT TCGTTTTGAG 
ATTGTGGAAG ATGGCGGTTT CTTTTTAAGG GTGATTTCTG CTTATGTGCG TAACTTAGAG 
AAGTTAGGAG TGCAGGTTAA TATCCGCACT AGCGACTTTG CCCTGCATCA AAAGCGGATG 
AATGAATACG ATTTTGATAT GACCACTGTT CGATTTCAGG ATTCTCAAAA TCCAGGCAAT 
GAACTTTGGG ATCGCTTTGG CAGTCAAGCG GCCAAAGAAA AAGGCTCCGA TAACGTCATC 
GGCGTACAAT CACCAGTCGT AGACGCCTTG ATCGAGGAAA TTACGAAGGC GCAAAATCGT 
GAACAGTTAA GAGCCGCAAC TAGAGCGCTT GACCGTGTCT TATGGAATAG TTATTACGTT 
GTACCCCAGT GGTACAACCC AACCCATCGC GTTGCCTTCC GCCACGAGAT GCGCTACCCA 
GAGCCGCCTC TGTACTATTC GGCTGAGTTA TGGATTATGC AAAATTGGTG GAAAGAGGAG 
GCTAAATAA

Protein sequence

MPTRTLIRQF AHFLLLALLG ALGANTTMAG QGIAQYGIPK YSDGFAHFDY VNPNAPRGGT 
LVLPNPGQRT SFDKFNPFTL RGITAPGIDL MFESLAEGSA DEVSSIYGLL ADDIQVAKDR 
KSVTFHIRPE AKFSDGSPVL ATDVKYSFDT LMSGKAHPRY KTTFADIKEA VVLSDQSIRF 
DFKNDNAELP ILAGTFPVFS RNWGKQPDGS IIPFEKLAFD APLASGPYLI ESFKAGKSIV 
YKKNLNYWAD QLSRPLNVRV GFYNFDRVLY KLYSDDAVRL EAFKAGEFDA LVEYRAKIWA 
KGYVGSKFDK GILLKKAFLN HNGAGMQGFA MNVRRPIFKD ARVREALGYA LDFEWLNRQI 
FFDQYSRINS YFTNSDLSAN FDGPHKPTEG ELKLLKPLKA KYPQWVPDAV FGPMPAALST 
KPPGSLRQNL KKARELLMHA GWQYRDGALR NEKGEPFRFE IVEDGGFFLR VISAYVRNLE 
KLGVQVNIRT SDFALHQKRM NEYDFDMTTV RFQDSQNPGN ELWDRFGSQA AKEKGSDNVI 
GVQSPVVDAL IEEITKAQNR EQLRAATRAL DRVLWNSYYV VPQWYNPTHR VAFRHEMRYP 
EPPLYYSAEL WIMQNWWKEE AK