Gene NATL1_04601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_04601
Symbol	metB
ID	4780470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	422288
End bp	423457
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	38%
IMG OID	640083737
Product	putative cystathionine gamma-synthase
Protein accession	YP_001014289
Protein GI	124025173
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGATCAG TAAAAAGAGA CAAGAAGTTC AGCAATGGAG TAAACACAAG AGTCATTCAT 
CACAAAGATA ATTTTTCTGA AGGAACTGGT TCAATAATGC CGCCAATCTT TCCAACCTCA 
ACGTTCGTTC ATGGCAATGA GGGTGGCTTT GATTACACTC GTTCAGGAAA TCCAAATTTT 
CGAATTCTTG AATCAGTTTT GTCTGATCTG GAAGAGTGTC AATTCGCTAG TGTATTTAGT 
TCTGGAGTCG CTGCGATTAC AGCAATAGTC TCCACTCTTC AGGCTGGAGA CTTAATCCTT 
TGTGAGGAGA ACCTTTATGG ATGTACGGTG AGATTATTTG AACAAGTTTT TAATCGTTTT 
GGATTAAAAA CTCAATGGAT AGACTTTACT AAGCCCAATT TCCAAGAAGT CATTTCAAAT 
CACAAACCCG CGATGATTTG GATCGAAAGT CCTACTAACC CACTCCTCAA AATTATTGAT 
ATTGAAGGGA TTTGTCATTT CTCAAATAAA ATGAAAATAC CTGTTGTTGT AGACAATACT 
TTTGCAACAC CTCTATTACA AAGACCTCTT AAACTTGGAG CGACCTTATC TTTAACTAGC 
ACGACCAAGT TTATTAATGG TCACTCAGAT GCACTTGGAG GTGCAGTATG CACCGAGAAT 
CCTATCTGGA GAGACAAGCT AAATTTCGCC CAGAAAGCTC TTGGATTAAA CCCTTCTCCC 
TTTGATTGCT GGCTTATCAC ACGAGGAATA AAAACTCTTC CACTTCGCCT AGAAAGACAA 
GTTAATAATG CATCCAAAAT AGCTAATCAA TTAGCCGATA ATCCAGCAAT AAAATATGTT 
CGATATCCTT TCAGGAATGA TCACCCACAA TGTAAATTAG CAAAAAAACA AATGGCTATG 
GGAGGAGCAA TTGTTACTGC CACTGTTAAC GCAACCCAAG CTCAAACCTA TTCATTTTGT 
AAAAGTCTTC ATTACTTCAA AATGGCAGAA AGTCTGGGAG GAATTGAAAG TCTTGTTTGC 
CATCCAGCTA CAATGACACA TGCTTCAGTG TCCAAGGAAA CAAAATTAAA AATTGGAATT 
ACTGATTCAC TTATTCGGTT TTCTATTGGA TGTGAGGACA TTGAAGACTT AAGTGCTGAT 
TTGAATCAAG CCTTAGGAAC TATCTCTTGA

Protein sequence

MGSVKRDKKF SNGVNTRVIH HKDNFSEGTG SIMPPIFPTS TFVHGNEGGF DYTRSGNPNF 
RILESVLSDL EECQFASVFS SGVAAITAIV STLQAGDLIL CEENLYGCTV RLFEQVFNRF 
GLKTQWIDFT KPNFQEVISN HKPAMIWIES PTNPLLKIID IEGICHFSNK MKIPVVVDNT 
FATPLLQRPL KLGATLSLTS TTKFINGHSD ALGGAVCTEN PIWRDKLNFA QKALGLNPSP 
FDCWLITRGI KTLPLRLERQ VNNASKIANQ LADNPAIKYV RYPFRNDHPQ CKLAKKQMAM 
GGAIVTATVN ATQAQTYSFC KSLHYFKMAE SLGGIESLVC HPATMTHASV SKETKLKIGI 
TDSLIRFSIG CEDIEDLSAD LNQALGTIS