Gene NATL1_15201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_15201
Symbol	leuA
ID	4780698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1233783
End bp	1235402
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	39%
IMG OID	640084802
Product	2-isopropylmalate synthase
Protein accession	YP_001015342
Protein GI	124026226
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR00973] 2-isopropylmalate synthase, bacterial type

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.381079
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAAG ATCCGGGCCG AGTTTTAATT TTTGACACTA CATTAAGAGA TGGAGAGCAA 
TCTCCTGGAG CTAGTCTTAA TTTAGAAGAA AAGTTAGCTA TTGCTCAACA ATTAGCAAGA 
TTAGGAGTTG ATGTTATTGA GGCAGGATTC CCTTTTGCTA GCCCTGGGGA TTTCGCTGCA 
GTTCAGAAAA TAGCTGAGAA TGTAGGAGGA GAAGAAGGAC CTATCATTTG CGGACTATCA 
AGAGCCTCAA AACCTGATAT CAAAGCTTGT GCCAATGCGA TTGCTCCAGC CCCAAAAAAA 
AGGATTCATA CCTTCATTGC AACAAGTGAT ATACATCTTG AACATAAATT AAGGAAATCC 
AGAAAAGAAG TACTTGATAT CGTTCCAGAT ATGGTTGGCT ATGCTAAAAG TTTTGTTGAT 
GACGTTGAAT TTTCCTGTGA AGATGCAGCA AGAAGTGATT TAGATTTTCT TTATGAAGTA 
ATAGAACTAG CCATATCCTC AGGGGCTAAT ACAATAAATA TTCCAGATAC AGTTGGTTAT 
ATAACCCCTT CTGAATTTGG AGATTTGATA TTAAATATCA ACGAAAATGT TCCAAATATC 
AATGAGGCAG TTCTGTCAGT TCATGGTCAC AACGATTTAG GACTTGCTGT CGCAAACTTC 
CTTGAAGCTG TAAAGAATGG AGCTAGACAA CTTGAATGCA CCATTAACGG AATAGGTGAG 
AGAGCAGGTA ATGCTGCTTT AGAAGAATTA ATCATGGCGC TTCATGTAAG AAGATCATAT 
TTTAATCCAT TTTTTGGGAG GCCTCCTGAA TCCCCTACTC CTTTGACAGC AGTTAGAACA 
GAGGAGATAA CTAAGTCTTC TCGCTTGGTT TCAAATTTGA CTGGGATGGT CGTACAACCG 
AACAAAGCAA TTGTTGGGGC AAACGCTTTT GCGCATGAAT CTGGAATACA CCAAGATGGA 
GTATTGAAAA ATAGGCTTAC ATATGAAATT ATCGATGCAA AAACAGTAGG GTTGTCTGAC 
AATAAGATTT CTTTGGGAAA ATTAAGTGGT AGGAGTGCTG TTCGAGCAAG ATTAGAGGAC 
CTTGGATATG ATTTAAACAG AGAAGATCTT AATGACGCTT TCGCTAGATT TAAAGATTTA 
GCCGATAGAA AAAGAGAGAT AACAGATCGT GATCTAGAGG CCATTGTTAG TGAACAAGTT 
CAGCTGCCAG AAGCATTGTT CCAATTAAAA TTGGTCCAAG TAAGCTGTGG CACTTCTCTA 
ATGCCAACTG CAACAGTAAC TGTTGTTGGA GAAGATGGAG AGGAGAAGAC CGCCGTCTCT 
CTTGGAACAG GTCCTGTTGA TGCAGTAGTA CGAGCCTTGG ATTCCCTAAC TGAAGAACCT 
AATGAATTGA TTGAATTCTC AGTAAAGTCA GTTACAGAGG GGATAGATGC TCTGGGTGAA 
GTTACTATTA GAATAAGAAG AGATGGAAAT CTCTTTTCTG GCCATTCTGC AGATACTGAC 
GTTGTTGTTG CCGCTGCTCA AGCATACATA AATGCTCTTA ATAGATTAGT AGCTGCTCAT 
GGAAGGAAAT CCATTCATCC ACAACATGAT TTGGCTAAGG TAGACAAAAA AGGGATTTGA

Protein sequence

MAKDPGRVLI FDTTLRDGEQ SPGASLNLEE KLAIAQQLAR LGVDVIEAGF PFASPGDFAA 
VQKIAENVGG EEGPIICGLS RASKPDIKAC ANAIAPAPKK RIHTFIATSD IHLEHKLRKS 
RKEVLDIVPD MVGYAKSFVD DVEFSCEDAA RSDLDFLYEV IELAISSGAN TINIPDTVGY 
ITPSEFGDLI LNINENVPNI NEAVLSVHGH NDLGLAVANF LEAVKNGARQ LECTINGIGE 
RAGNAALEEL IMALHVRRSY FNPFFGRPPE SPTPLTAVRT EEITKSSRLV SNLTGMVVQP 
NKAIVGANAF AHESGIHQDG VLKNRLTYEI IDAKTVGLSD NKISLGKLSG RSAVRARLED 
LGYDLNREDL NDAFARFKDL ADRKREITDR DLEAIVSEQV QLPEALFQLK LVQVSCGTSL 
MPTATVTVVG EDGEEKTAVS LGTGPVDAVV RALDSLTEEP NELIEFSVKS VTEGIDALGE 
VTIRIRRDGN LFSGHSADTD VVVAAAQAYI NALNRLVAAH GRKSIHPQHD LAKVDKKGI