Gene Glov_0163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Glov_0163
Symbol
ID	6367734
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter lovleyi SZ
Kingdom	Bacteria
Replicon accession	NC_010814
Strand	-
Start bp	153626
End bp	155389
Gene Length	1764 bp
Protein Length	587 aa
Translation table	11
GC content	60%
IMG OID	642675560
Product	para-aminobenzoate synthase, subunit I
Protein accession	YP_001950417
Protein GI	189423240
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase [COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00553] aminodeoxychorismate synthase, component I, bacterial clade

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGACA CCTGCCCTAC CATACTGCTG GACTCCTGCA GCGCAGACCG TTTCAGCGCA 
TCCTGGCGCT TTGACGGCCA CATCCGTACC CTGATTGCCG AGACCTCTGA TCAGGTGCAA 
TCAGTACTTG AGCAGGCCGA GGCAGCCACC CGGCAGGGGC TGTATGCCGT GGGATTTGTG 
GTCTATGAGG CCGCCCGGGC ATTAAACCCG CACCTGCCGT CGCTGCCACC CCGCGCCGGC 
CTGCCGCTGG CCTGGTTCAG CCTGTTCAGG GAGCGCCATT GCGTAACAGC GGGGGATGGC 
CTGCCGGACC ATACGACTGC CACACCGGAA CTCCAGCCTG CCTGCAGTCC GGCCGACTAC 
GGGATTGCCA TCAGCCGGAT TCACACGGCG ATTGAGCAGG GTGAGACCTA TCAGATCAAC 
CACACCTTTC CACTGCAGGG GCAGTGGCAG GGTGATCCGC GACAGCTCTA TCGCAGCCTG 
TTACTGGCCC AGCAACCGGC CTTTGGCGCC TTTCTGGATA TCGGCAGCCA CACGATCATC 
TCTGCTTCAC CAGAGCTGTT CTTCAATATC AAGGATGGTC TGATCACCAC CAGGCCGATG 
AAAGGGACCG CCCCCCGCGG ACGCTTTCCT GCTGAAGACC GGGCCCTGCA AGAACAGCTG 
CAGCAGGATA TGAAGGAGCA GGCCGAGAAC CTGATGATCG TTGACCTGCT GCGCAACGAC 
CTGGGGCAGG TGGCCCGGAC CGGCACGGTG CAGACCGAGA GGTTGTTTGA GGTAGAGACC 
TATCCCACGG TGCATCAGAT GACCTCCACC ATTACCGCAC AACTGAAGCA GGATATCGGC 
CTGCTGGAGC TGTTCAGGGC CCTGTTCCCC TGCGGGTCGG TCACCGGTGC TCCCAAGCGC 
CGCAGCATGG AGTTGATTGC TGAAATCGAA GGTCAACCGC GCGGGATCTA CTGCGGTACC 
ATCGGCTATC TGGCTCCCGG GGGTGAAATG GCCTTTTCAG TTGCCATCCG CACCTTGGTG 
CTAAACAAAC AGACCGGCCG GATCAGCCTG GGGGTGGGCA GTGGGATTAC CTGGGATGCC 
CGACCCGATG CCGAGTATGT TGAATGCCTG CACAAGGCCG CCTTTCTCAA ACCGCGTCCG 
CAACCCAGAC TGCTGGAATC ACTGCTGTTG GAAGACGGCA ACTATCCCCG CCTGGAGCAG 
CACCTTGAAC GGCTCGGCTG GTCTGCGGCC CGGCTGGGCT ATTGTTGTGA CCGGGAACAG 
ATCAGACAGG CGTTGCTGGC CCATGCCGCC GGCACAACCG GTCAGCACAA GACCCGGCTG 
CTGCTGGCAC AGGATAGTAC CTTTCAGATT GAATCAGCCC TGTTACTACA GATCCAGCAG 
CCGCTGAAGC TTGCTCTGGC CACAACATTT GTAGACCCAA CTGACCTGCT GCTGTACCTC 
AAAACCGAAC AACGCCAGCG CTACGAACAG GCCCGTCAGG AACAGCCAGA GGCGGATGAG 
GTGTTGCTCT GCAACAATCG GGGTGAACTG ACTGAGGGTA GTTTCACCAA TCTGGTGCTG 
AAGCTGGATG GTCGGCTGGT AACCCCGCCG CTGGCCAGTG GTCTGCTGCC GGGGGTGATG 
CGTCAGCAAC TGCTGGAACA GGGAACCATA GAAGAGCAGG TGTTATACCC GCAGGATCTG 
CAGCGGGCTG AAGAGATCTG GCTGATCAAC AGCGTACGGG GCTGGCTGCG GGCAGAGCTG 
ATTAAAGGAG CAAGAACGTG CTAA

Protein sequence

MPDTCPTILL DSCSADRFSA SWRFDGHIRT LIAETSDQVQ SVLEQAEAAT RQGLYAVGFV 
VYEAARALNP HLPSLPPRAG LPLAWFSLFR ERHCVTAGDG LPDHTTATPE LQPACSPADY 
GIAISRIHTA IEQGETYQIN HTFPLQGQWQ GDPRQLYRSL LLAQQPAFGA FLDIGSHTII 
SASPELFFNI KDGLITTRPM KGTAPRGRFP AEDRALQEQL QQDMKEQAEN LMIVDLLRND 
LGQVARTGTV QTERLFEVET YPTVHQMTST ITAQLKQDIG LLELFRALFP CGSVTGAPKR 
RSMELIAEIE GQPRGIYCGT IGYLAPGGEM AFSVAIRTLV LNKQTGRISL GVGSGITWDA 
RPDAEYVECL HKAAFLKPRP QPRLLESLLL EDGNYPRLEQ HLERLGWSAA RLGYCCDREQ 
IRQALLAHAA GTTGQHKTRL LLAQDSTFQI ESALLLQIQQ PLKLALATTF VDPTDLLLYL 
KTEQRQRYEQ ARQEQPEADE VLLCNNRGEL TEGSFTNLVL KLDGRLVTPP LASGLLPGVM 
RQQLLEQGTI EEQVLYPQDL QRAEEIWLIN SVRGWLRAEL IKGARTC