Gene Pnec_1042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnec_1042
Symbol
ID	6183030
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polynucleobacter necessarius subsp. necessarius STIR1
Kingdom	Bacteria
Replicon accession	NC_010531
Strand	-
Start bp	904716
End bp	905924
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	46%
IMG OID	641671654
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_001797831
Protein GI	171463718
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	0.37384
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAGTA AAACTACACG CAAAAAACTG GATTTTTCTA AACTTGCACT CGAAACCATA 
GCAGTTCGTG TAGGCACTCG TCGTACGGCT GAATATCAAG AGCACTCCGA GGCAATGTTC 
CTCACATCAA GCTTTTGCTT TGATAGCGCC GAATTAGCGG CTGATGGCTT TGCTCATGCT 
GATCAAGGTT TTATTTATTC ACGCTTTACC AATCCAACCG TGAGTATGTT CCAAGATCGC 
TTGGCTGCTC TTGAGGGTGG CGAAGCTTGT ATTGCTACTG CCTCTGGTAT GTCTGCCATT 
CTGACAATGG CAATGGCTCA CCTGCAAGCA GGTGATCACG TTATTTGCTC GCGTTCTGTA 
TTTGGTGCAA CGATTCAGTT GTTCACGAAT ATTTTGGGTC GCTTTGGTAT TACGACAACT 
TATGTTGATT TGACTGATAC TAAGTCATGG CAGGCTGCTG TCCAACCAAA CACCAAACTC 
TTTTATCTAG AGACACCTTC CAATCCTTTG ACTGAGATTG CGGATATCAA AGCAATTTCA 
AGGATAGCAA AAAAGGCAGG TGCCTTGTTT GCTGTAGATA ACTGCTTCTG CACTCCGGCA 
TTACAAAAAC CATTGGCGCT TGGTGCTGAT GTTGTGATTC ATTCTGCAAC TAAGTATTTA 
GATGGTCAGG GCAGGATGGT TGGTGGCGCC ATTGTAGGCA ACAAAGATTT CATTATGGGA 
AAAGTGTTCC CTTATGTGCG TACTGCAGGC CCAACACTGT CAGCATTCAA TGCTTGGGTA 
TTCTTAAAAG GCTTGGAGAC TCTAGAGCTT CGCATGAAGC AGCAGAGTCA AAATGCGCTT 
GCCTTGGCTC AATGGTTGGA GAAGCAACCT GGCGTAGAAC GCGTGTACCA TCCAGGCCTG 
AAAACGCACC CTCAACATGC CTTAGCTAAA CGCCAGCAAA AAGAGGGTGG GGCGATTCTA 
TCTTTTACCC TCAAGGGTGG AAAGAAGGCG GCATTCAAAC TTATCAATCA AACCAAGCTC 
TGCTCGATCA CTGCAAACTT AGGGGATACC CGCACAACAA TTACCCATCC AGCGACAACG 
ACACATTGTC GCGTCAGTCC TGAAGCCAGA AAAGCAGCAG GCATATCCGA TGGATTGGTG 
CGTATTGCAG TTGGCCTCGA GAATATCAGC GATTTAAAGA ACGACCTCCT TGGTGGACTC 
AAAAAATAA

Protein sequence

MKSKTTRKKL DFSKLALETI AVRVGTRRTA EYQEHSEAMF LTSSFCFDSA ELAADGFAHA 
DQGFIYSRFT NPTVSMFQDR LAALEGGEAC IATASGMSAI LTMAMAHLQA GDHVICSRSV 
FGATIQLFTN ILGRFGITTT YVDLTDTKSW QAAVQPNTKL FYLETPSNPL TEIADIKAIS 
RIAKKAGALF AVDNCFCTPA LQKPLALGAD VVIHSATKYL DGQGRMVGGA IVGNKDFIMG 
KVFPYVRTAG PTLSAFNAWV FLKGLETLEL RMKQQSQNAL ALAQWLEKQP GVERVYHPGL 
KTHPQHALAK RQQKEGGAIL SFTLKGGKKA AFKLINQTKL CSITANLGDT RTTITHPATT 
THCRVSPEAR KAAGISDGLV RIAVGLENIS DLKNDLLGGL KK