Gene Mlab_1397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_1397
Symbol	trpD
ID	4796162
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	-
Start bp	1426286
End bp	1427308
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	50%
IMG OID	640100081
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001030830
Protein GI	124486214
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0000237469
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGCAG AATGCATTAA AAAAGTAGCA TCACATTCTG ATCTGAGCGT TTACGAGGCA 
AAAGGGGCGA TGCAGGATAT CATGTCAGGA AACGCTACCG ATGGTCAGAT CGGCGCATTC 
CTTACAGCCC TTGTAATGAA AGGGGAGACA AGTTCCGAGA TCGCCGCTTT TGCATCCGTG 
ATGCGGGAGA ACGCCGTCCA AATAACTCCG AAAAGAAACG GTATGCTTGT CGATACATGC 
GGCACCGGAG GCGATGGAAA AAACACCTTC AACATCAGTA CGGCAGCGGC TTTTACTGCG 
GCCGGTGCTG GAGTGACTGT CGTCAAGCAT GGAAACCGGG GAGCGACCAG CAAATGCGGA 
TCCGCTGATG TTCTGGAAGC CCTCGGGATA AAAATCGATA TTTCGCCGGA AAGGGTCTGT 
GAAATCATCG ATGAAAACGG CATAGGGTTT ATGTTTGCCC AAAGCCATCA TCCTGCTATG 
AAGTATGCGG GCAAGGTGAG AAAGGAGATC GGTATCCGCA GCTTCTTCAA TCTTATCGGT 
CCCCTCTCGA ATCCTGCAGG AGCCGATGCA CAGCTGCTTG GGGTCTATGA CTCTCCCCTC 
ACGGAAAAGA TCGCCGAAGT TCTCAATATT TTGGGTACGA AAAGAGCAAT GGTTGTCCAT 
GGTGATGGAT ATGATGAGAT AACAACGACT GGTATTACTC AGGTTTCCGA GGTGAACGAC 
GGGCAGGTCA GGAGTTATTC CTTGGATCCG TCATCCTTCG GGTTCCAAAA AGCCGATGCC 
GCCTCCCTCT TCGGTGGAGA TTCTCAGTAC AATGCACACA TAATCAGATC GGTTCTTTCG 
GGAGATGAAG GTCCGAGACG GGATATCGTC ATCCTCAATG CCGCAGCTGC AATCTATCTT 
GGAGAGAGGG CAGGGAGTAT CGCGGATGGG ATCAAATATG CGGAAAAATC CATCGATTCG 
GGCCTTGCGC TCGAGAAACT GGAGAATCTG ATTCTCCTTT CTGGAGGCAA AAATGATTCT 
TGA

Protein sequence

MIAECIKKVA SHSDLSVYEA KGAMQDIMSG NATDGQIGAF LTALVMKGET SSEIAAFASV 
MRENAVQITP KRNGMLVDTC GTGGDGKNTF NISTAAAFTA AGAGVTVVKH GNRGATSKCG 
SADVLEALGI KIDISPERVC EIIDENGIGF MFAQSHHPAM KYAGKVRKEI GIRSFFNLIG 
PLSNPAGADA QLLGVYDSPL TEKIAEVLNI LGTKRAMVVH GDGYDEITTT GITQVSEVND 
GQVRSYSLDP SSFGFQKADA ASLFGGDSQY NAHIIRSVLS GDEGPRRDIV ILNAAAAIYL 
GERAGSIADG IKYAEKSIDS GLALEKLENL ILLSGGKNDS