Gene Acid345_3885 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3885
Symbol
ID	4072220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4594076
End bp	4595119
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	62%
IMG OID	637985909
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_592959
Protein GI	94970911
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACGG ACGCCCTACA TCAGATAGTC GTTCACCGGC GGGACCTTAC GCGCGAACAG 
GCGCGCGAAA CCATGGCTGA CGTCCTGGGA GGAAAAACCA CCGACGCGCA GATCGGGGCG 
TTGCTCGTCG GGTTGCAGAT GAAGGGCGAG ACGGTGGATG AGATTGTCGG CTTCGCGGAG 
GCGATCCGTG CGGCCGCGAC GCCGTTGATC GTGCGCGACT CAGCGCTCGA CGTGAGCGGC 
ACCGAGCGCG ATGCGCTGCT CGATACCTGC GGCACCGGGG GCGATGCCAG CGGGACGTTC 
AACATCTCGA CGGCGACGGC ATTAGTTGTG GCGGGTGCGG GCGTGAAGGT GGCGAAACAC 
GGCAACCGTA GTGTGACTTC GAAGTGTGGG TCGGCGGATG TGGTCGAGGC GCTGGGAGTG 
AACATCAACC TTCCGGCAGA ACGCATGGCG GAGTGCCTGG AGAAAGTCGG GATCGCGTTC 
CTGTTTGCGC CGGCGATGCA CACGGCGATG AAGTATGTGC AGCCGGCGCG GCGTGAGTTG 
AAGATGCGCA CGGTGTTCAA TCTGCTGGGA CCGCTCACGA ACCCGGCGAA TGCTTCATGC 
CAGGTTGTAG GTGTGTACAC AGGGCAGCTT GTTGAGAAAC TGGCGCAGGC CCTCTTACAG 
CTTGGGTTGA AGCGCGCGCT GGTGGTACAT GGGTGGGATG GACTGGATGA GATCACGATA 
TCCGGCCCGA CGAAAGTTGC GGAAGTACGC GATGGAAAGG TGACATCGTA CGAGATTTCG 
CCCGAACAGT TTGGACTGCA ACGCGCGCCG CTGAGTGCGC TCGAGGGCGG CGATGCGCAG 
GTCAATGCTG CGATCATTCG CGCGATTCTT GATGGCGAGC GGTCTCCGAA GCGCGATGTT 
GTGCTGCTGA ATGCTGCCGC GGCACTGGTG GCGGCGGGTC AGGCAGAGAC GATGGGAGCG 
GCGATTCCCG TTGCGGCGTA TGCGATTGAT AGTGGGCAGG CGAAAGGGAG GCTGCGGTTG 
CTGGTGGAGT TTACGAACCT ATAG

Protein sequence

MITDALHQIV VHRRDLTREQ ARETMADVLG GKTTDAQIGA LLVGLQMKGE TVDEIVGFAE 
AIRAAATPLI VRDSALDVSG TERDALLDTC GTGGDASGTF NISTATALVV AGAGVKVAKH 
GNRSVTSKCG SADVVEALGV NINLPAERMA ECLEKVGIAF LFAPAMHTAM KYVQPARREL 
KMRTVFNLLG PLTNPANASC QVVGVYTGQL VEKLAQALLQ LGLKRALVVH GWDGLDEITI 
SGPTKVAEVR DGKVTSYEIS PEQFGLQRAP LSALEGGDAQ VNAAIIRAIL DGERSPKRDV 
VLLNAAAALV AAGQAETMGA AIPVAAYAID SGQAKGRLRL LVEFTNL