Gene Plav_3169 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_3169
Symbol
ID	5455164
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	+
Start bp	3381686
End bp	3383194
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	64%
IMG OID	640878758
Product	anthranilate synthase component I
Protein accession	YP_001414432
Protein GI	154253608
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.276011
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.09914
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTCGC CCGACTACGC CAGTTTCGAG GCGTCGTACA ACGCGGGTAC GGCGCAGGTG 
GTCTATGCGC GTCTCGTCGC GGACCTCGAA ACGCCTGTCT CCGCCATGCT CAAGATCGCG 
GACGGAAAGC CGAACAGCTT CCTGCTCGAA TCCGTCGAGG GCGGCGACAG CCGCAACCGC 
TATTCGATCA TCGGCTTCGC GCCGGATGCC ATCTGGCGGA CGCGGGGCGA CAAGGCGGAG 
CTGAACCGCA AGGCCCGCTT CGGGGATACT TACGAGCCCT GCCCCGGCGG CGCGCTGAAG 
AGCCTGCGTG CCTTCATCGA GGAAAGCCGC ATCGACCTGC CGGAGGAGCT GCCGCCGATG 
GCCGCCGGCG TCTTCGGCTA TATGAGCTAC GACACGGTGC GCCTGATGGA GCACCTGCCG 
AACGAGAACC CGGACGCGCT CGGCTTGCCG GACGGCATCT TCATCCGTCC AACGATCATC 
GCCGTCTTCG ATTCCGTGAA GGACGAAGTT ACCGTCGTCA CGCCCGTGCG GCCGGAGCCC 
GGCGTCAGCG CACATGCCGC CTATACGCGC GCGAGCGAAC GTGTCGGCGA TGTGATCGCC 
GAGTTCGATA CGGCGCTGCC GCATCTCCAC CGCGATGCGG AAATCGGGCC GCTCGAAGAG 
CCGTGCTCCA ACACGCCCAA GGATGCCTAT TTCGGCATGG TCGCCCGTGC GAAGGAATAC 
ATCGCCGCCG GCGACATTTT TCAGGTCGTG CTCTCGCAGC GTTTCGAGGC GCCGTTCGAG 
CTGCCGCCCT TCGCGCTCTA CCGGGCGCTC CGCCGCATCA ACCCGTCGCC CTTCCTTTAT 
TTCCTGAATT TCGAGGATTT CTCCATCGTC GGCTCGAGCC CGGAAATTCT CGTCCGCGTG 
CGGAACAACC GCGTCACCAT CCGCCCTATC GCGGGCACGC GCCATCGCGG AAAGAACAAG 
GCGGAAGACG AGGCGATCTC CGAAGAACTC CTCGCCGATC CGAAGGAGCG CGCCGAGCAC 
CTCATGCTGC TCGATCTCGG GCGCAACGAT GTCGGCCGCG TCTCGAAGAT CGGTTCGGTC 
GATGTGACGG AACGTTTCGC GCTCCAGTAC ACATCGCACC TCATCCACAT CGTCTCGAAC 
GTCGAAGGCG ACCTCGATCC CGCCTATGAC GCGATTTCCG CCCTTGTCGC GGGCTTCCCG 
GCAGGCACCG TTTCCGGCGC GCCGAAAGTC CGCGCGATGG AAATCATCGA CGAACTCGAA 
CTCGAAAAGC GCGGCCCCTA TGCCGGCTGC GTCGGCTACT TCTCGGCGGC GGGCGAAATG 
GACACCTGCA TCGTGCTCCG CACCGCCATC GTCAAGGACG GCAAGATGTA CGTCCAGGCA 
GGCGGCGGCG TGGTCGCGGA TTCAAGCCCC GAAGGCGAGT ATCAGGAAAG CGTCAACAAG 
GCCAAGGCCC TCTTCCGCGC GGCGGAAGAA GCCGTGCGCT ACGCATCGCA GGTGGGGAAA 
AGGCAGTAA

Protein sequence

MISPDYASFE ASYNAGTAQV VYARLVADLE TPVSAMLKIA DGKPNSFLLE SVEGGDSRNR 
YSIIGFAPDA IWRTRGDKAE LNRKARFGDT YEPCPGGALK SLRAFIEESR IDLPEELPPM 
AAGVFGYMSY DTVRLMEHLP NENPDALGLP DGIFIRPTII AVFDSVKDEV TVVTPVRPEP 
GVSAHAAYTR ASERVGDVIA EFDTALPHLH RDAEIGPLEE PCSNTPKDAY FGMVARAKEY 
IAAGDIFQVV LSQRFEAPFE LPPFALYRAL RRINPSPFLY FLNFEDFSIV GSSPEILVRV 
RNNRVTIRPI AGTRHRGKNK AEDEAISEEL LADPKERAEH LMLLDLGRND VGRVSKIGSV 
DVTERFALQY TSHLIHIVSN VEGDLDPAYD AISALVAGFP AGTVSGAPKV RAMEIIDELE 
LEKRGPYAGC VGYFSAAGEM DTCIVLRTAI VKDGKMYVQA GGGVVADSSP EGEYQESVNK 
AKALFRAAEE AVRYASQVGK RQ