Gene PMN2A_1048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PMN2A_1048
Symbol
ID	3606435
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL2A
Kingdom	Bacteria
Replicon accession	NC_007335
Strand	-
Start bp	1542633
End bp	1543910
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	42%
IMG OID	637687918
Product	putative urea ABC transporter, substrate binding protein
Protein accession	YP_292241
Protein GI	72382886
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID	[TIGR03407] urea ABC transporter, urea binding protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.293483
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCTTT CAAAGCGCAT TTTTGCAGGT TTAGCTACTG CCTCTTTAGC CGTAACTGTT 
ACTGCTTGTG GTGGATCAGA TTCCTCTGGC AACTTTGACG ACACCGTAAC TGTTGGAATT 
CTCCATTCTC TTTCAGGGAC AATGGCAATC TCGGAATCAA CTCTTGTTGA TACAGAGAAA 
ATGGCTATTG AGGAAATCAA TGCAGCTGGC GGTGTAACAG TCGACGGTAA AAGCTATAAA 
ATTGAATACA TCGTTGAAGA TGGTGCCTCA GATTGGCCTA CCTTTGCAGA GAAATCTAAG 
AAGTTAATCG ACCAGGATGG AGTACCAGTA GTCTTTGGCG GCTGGACTTC TGCAAGTCGA 
AAGGCAATGC TTCCAGTTTA TGAATCAAAA GATGCATTCC TTTATTACCC AATTCAATAT 
GAAGCACAAG AGTGCTCCAA TAACATTTTC TATACAGGAG CGACTCCAAA TCAGCAGTCT 
GAGCCTGCCA CTGATTTCAT GTATAAGCGC TCTCCAGCTG CTGGAGGAGA TTTCTTCTTA 
GTTGGTTCTG ATTATGTTTT TCCAAGAACT TCTAACACAA TTACTAAAGC TCAAGTGAAA 
CAACTTGGCG GAAAAGTTGT TGGAGAAGAT TATCTTCCTT TAGGTAATAC TGAGGTAGCA 
CCTATTATCT CGAAGATAAA AGTTGCTCTT CCTGATGGTG GAATCATAGT TAACACTTTG 
AATGGTGACC AAAACGTTGC TTTCTTCAAA CAAATCCAGG ACGCAGGAAT CACTCCTTCT 
AATGGTTATT ACGTAATGAA CTACTCCATT GCGGAAGAAG AGATTAGTAC GATTGGACCT 
GAGTTCCTTG AGGGCCACTA TGGTGCTTGG AACTACATGA TGTCTATTGA TACGCCAGCT 
TCTAAGAAAT TTGCTAAGAG CTTTAAGAAG AGATGGGGTA GTGATCGTGT TGTGGCTGAT 
CCTCAAGAAT CTGCCTATAA CATGGTTTAT CTTTGGAAGC AGGCAGTTGA AGATGCAGGT 
ACATTTGATG ACAATGCGGT TAGAGAAGCA TTGGTTGGTC AGACATTCGA TGCTCCTCAG 
GGTCCAGTAG AAGTTATGGC AAATCATCAC CTATCTCAAA CAGTGAGAAT CGGTGAAATC 
AATGCAGAGG GTGGATTTAC AATCCTTGAA GAAACTGGAG TAGTTGAGCC ACAAGCATGG 
AACCAAAAAC ATCCAAGTTC AAAAGGTTAC GCTTGTGATT GGACTGATCC TAAGAAAGGT 
GAAAAATATA GGATGTGA

Protein sequence

MKLSKRIFAG LATASLAVTV TACGGSDSSG NFDDTVTVGI LHSLSGTMAI SESTLVDTEK 
MAIEEINAAG GVTVDGKSYK IEYIVEDGAS DWPTFAEKSK KLIDQDGVPV VFGGWTSASR 
KAMLPVYESK DAFLYYPIQY EAQECSNNIF YTGATPNQQS EPATDFMYKR SPAAGGDFFL 
VGSDYVFPRT SNTITKAQVK QLGGKVVGED YLPLGNTEVA PIISKIKVAL PDGGIIVNTL 
NGDQNVAFFK QIQDAGITPS NGYYVMNYSI AEEEISTIGP EFLEGHYGAW NYMMSIDTPA 
SKKFAKSFKK RWGSDRVVAD PQESAYNMVY LWKQAVEDAG TFDDNAVREA LVGQTFDAPQ 
GPVEVMANHH LSQTVRIGEI NAEGGFTILE ETGVVEPQAW NQKHPSSKGY ACDWTDPKKG 
EKYRM