Gene A9601_14091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_14091
Symbol
ID	4718130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	1180203
End bp	1182002
Gene Length	1800 bp
Protein Length	599 aa
Translation table	11
GC content	27%
IMG OID	640079130
Product	hypothetical protein
Protein accession	YP_001009800
Protein GI	123968942
COG category	[V] Defense mechanisms
COG ID	[COG2274] ABC-type bacteriocin/lantibiotic exporters, contain an N-terminal double-glycine peptidase domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTACCA GAAACGTAGA AAATATTGAT ATTAATTTGC CGAATTTAAT TTATGCGCTT 
TGGAAAAAAT TAAAAGAACA AAGAAAAATG CAAATTATTT TTCTTTTTTG TTTTGTATTG 
GCTAGCGCAT TTTCCGAAGT TTTTTCATTA GGTTCAGTAT TGCCATTTTT ATATGTATTA 
ATAAACCCAA TAGGACTTTG GAATTTAACT TTCTTTAGAA ATATTTTTAT ATTTTTGGGT 
ATTAATAATC CTAATTACTT ATTACTCCCA ATGACAGTAA TTTTTTGTCT TTGTATAGTT 
TTTGCAGCTT TTTTTAGATT AGTCACTATT TGGCTAAACT GCAGATTGTC TGCTGCAATA 
GGTTCAGATT TGAGTTGTGA GGTTTTTACA AGAACTATTT TTCAACCATA TAAATACCAT 
TTAGAAAGAA ATAGTAGTGA ATTAATTGCG GCGATTAACA TTCATATTCC TCAATCTATT 
TATTCAATAA ATTTATTTTT TAAATTAATA AGTAACGCAA TTATTGCTTC AAGTATCATA 
ATTGCATTGT TAATTATCAA TCTGAAGATT GCCTTATCAT TAATAATTGT TTTTGGATTT 
GCTTATCTAT TGATTTCTAT TTTTATAAAA AATAAACTTG CTGCAAATAG TTTGTTTGCA 
GTAAATGCAA CTCAAAATCA ATTATCAATA ATACAAGAAA GTTTAGGTGG TATAAGAGAC 
TTGATAATTG ATCAAAATTT TAATTATTAC ATTAAAAAAT TTATTAAATA TGATAAACCA 
TTAAGAATAA GAGATTTACA AAATGAGTTT TTGGGTTCTT TCCCTAAATA TGCCTTAGAA 
GCTCTTGGTA TGATTCTTAT AGCTGTTTTA GGTTTCTTAA TTAAATCTTT ATCTCCTAGC 
ACAGTTAATG CAATACCACT TCTAGGAACT ATTGCTCTTG GGGCACAAAG ATTACTACCT 
TCTCTACAGC AAGTATTTAC AAGTTGGTCT GCAATAAAAG CTAAGCAAGA AAATTTAAAA 
AAAATACTTG ATATACTTGA TCGCCAAAAC TATAACAAAA ATTTTAATTT AGGATATTCT 
GAAATTTCCT TTAACAAGGA ATTAAGACTT TCATCAATAA GTTTTAAACA TTTAAATCAA 
AAAAAATCAA TATTTGAAAA TATCCACTTA ACTATTAATA AAGGCGAATG TCTAGGAATT 
ATTGGTACAA CAGGTAGTGG TAAAAGTACT TTTATAGATA TAGTTATGGG TTTGCTAATA 
GGCTCACAGG GGTACTTGAA AATTGATGGT CTAAATTTAT ATTCAGGGAA AGATAGTTCA 
AGAAAAATAA GGGCTTGGAT GTCAAAAATT GCGCATGTTC CTCAAAGTAT TTTTCTTTCT 
GATAGCACTA TTGCTGAAAA TATAGCTTTT GGTATTGAAT TAAATAATAT TGATTACAGA 
AAATTAAAAA ATGCTATTGA AGCAGCTCAA CTTAATGATT TTATTGAAAG TCTGCCGAAT 
AAATACAACA CTTTTGTGGG AGAAAGAGGG GTTAAATTAA GTGGAGGTCA AAGGCAAAGA 
ATTGGTATTG CTAGAGCATT TTATAAGAAT CCACAAATTT TAATTTTAGA TGAAGCAACA 
AGTGCATTAG ATATTAGAAC AGAGAGGAAA ATAATGGAAA AAGTAAATTG CCTAAGTAAA 
GACTTAACTA TCATTATTAT TGCTCATCGT CACTCAACTT TAAAAAACTG TGATAGGGTT 
ATTGAGATTA ATGGAGGTAA GATAATCAAA GAAGGTTTAC CTAAAGATGT GTTATATTAA

Protein sequence

MTTRNVENID INLPNLIYAL WKKLKEQRKM QIIFLFCFVL ASAFSEVFSL GSVLPFLYVL 
INPIGLWNLT FFRNIFIFLG INNPNYLLLP MTVIFCLCIV FAAFFRLVTI WLNCRLSAAI 
GSDLSCEVFT RTIFQPYKYH LERNSSELIA AINIHIPQSI YSINLFFKLI SNAIIASSII 
IALLIINLKI ALSLIIVFGF AYLLISIFIK NKLAANSLFA VNATQNQLSI IQESLGGIRD 
LIIDQNFNYY IKKFIKYDKP LRIRDLQNEF LGSFPKYALE ALGMILIAVL GFLIKSLSPS 
TVNAIPLLGT IALGAQRLLP SLQQVFTSWS AIKAKQENLK KILDILDRQN YNKNFNLGYS 
EISFNKELRL SSISFKHLNQ KKSIFENIHL TINKGECLGI IGTTGSGKST FIDIVMGLLI 
GSQGYLKIDG LNLYSGKDSS RKIRAWMSKI AHVPQSIFLS DSTIAENIAF GIELNNIDYR 
KLKNAIEAAQ LNDFIESLPN KYNTFVGERG VKLSGGQRQR IGIARAFYKN PQILILDEAT 
SALDIRTERK IMEKVNCLSK DLTIIIIAHR HSTLKNCDRV IEINGGKIIK EGLPKDVLY