Gene A9601_02791 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_02791
Symbol	cinA
ID	4716964
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	256725
End bp	257999
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	34%
IMG OID	640077979
Product	molybdenum cofactor biosynthesis protein
Protein accession	YP_001008674
Protein GI	123967816
COG category	[R] General function prediction only
COG ID	[COG1058] Predicted nucleotide-utilizing enzyme related to molybdopterin-biosynthesis enzyme MoeA [COG1546] Uncharacterized protein (competence- and mitomycin-induced)
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain [TIGR00199] competence/damage-inducible protein CinA C-terminal domain [TIGR00200] competence/damage-inducible protein CinA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCCTA ACTCCAAGGG AGTTGAGATT CTTTCAATTG GAACAGAGCT ACTCTTAGGA 
AATATTATAA ATACAAATGC TCAATGGATT TCTGAACAGT TGTCCCAATT AGGCTTAAAT 
CACTTTAGGC AATCAACTGT TGGTGATAAT TGTGATCGAA TTGTAAAAGT AATTCAAGAA 
ATTTCGAAAA GAAGTAATCT TCTAATTACA ACTGGTGGTT TGGGGCCCAC CCCAGATGAC 
TTAACTACTG AAGCAATAGC AAAATCTTTT AATGTAAATC TTTTTGAAAG ACCGCACTTA 
TGGGATGAAA TTAAACAAAA ACTGCCAAAC TCAAAACTCC AGGACGATTC ATCTAGCTTA 
AGGAAACAAT GTCTCTTCCC AAAAAATGCT CAAATAATTA ATAACCCTAG GGGCACTGCC 
CCGGGAATGA TATGGGAACC AATAGAAGGA TTTACTATTC TTACTTTCCC TGGAGTACCA 
AGTGAAATGA AAACTATGTG GGAAGAGACG GCGTGTGATT TTATTAAAAC CAAATTCTCA 
GATAATTATT CCTTTTTTTC AAATACTCTT AAATTTGCAG GTATTGGAGA ATCTAGTGTT 
GCAGAAAAAA TTAATGATCT ATTAAATCTT AAAAACCCGA CTGTTGCTCC ATATGCAAAC 
TTAGGAGAGG TTAAACTAAG AATCACAGCT CGAGCAAAGA ATCATTTAGA AGCAAAAAAT 
ATTATTCAAC CTGTAAAAGA AAAATTAAAA AAAGATTTTT CGAAATTTAT TTTTGGAGAG 
AATGATGATA CTCTTCCTAG CGTCTTAATA AGAGAATTAA CCGAGAGGAA CCAAACTATT 
GTTTTTGCTG AATCATGCAC CGGAGGCCTT CTATCTTCAT CACTAACATC AATATCAGGC 
TCATCTAAAG TTTTTAAAGG TAGTGTAGTT TCCTACAGTA ATGAGCTAAA AAATTCATTA 
TTAAATATTT CTGAAGAGAA GCTTACAAAA TATGGAGCTG TTTCTGAAGA AGTTTGTGAG 
TCCATGGCAA TTAATGCAAA AGAAAAATTA GGAGCAGATT GGGCAATAGC AATTAGTGGA 
ATAGCTGGTC CTAAAGGAGG CAGTCAAGAT AAACCGGTTG GACTTGTCTA TATATCAATT 
TCTGGACCGA ATAATCATAT AACTAATATA AAAAAACTAT TTAACTCAAC CCGAAATAGA 
GTAGAAATTC AAACACTAAG TGTAAATGTG TGTTTGAACA GCCTCAGATT AATCCTATTA 
TCTAATAGTA AGTAA

Protein sequence

MSPNSKGVEI LSIGTELLLG NIINTNAQWI SEQLSQLGLN HFRQSTVGDN CDRIVKVIQE 
ISKRSNLLIT TGGLGPTPDD LTTEAIAKSF NVNLFERPHL WDEIKQKLPN SKLQDDSSSL 
RKQCLFPKNA QIINNPRGTA PGMIWEPIEG FTILTFPGVP SEMKTMWEET ACDFIKTKFS 
DNYSFFSNTL KFAGIGESSV AEKINDLLNL KNPTVAPYAN LGEVKLRITA RAKNHLEAKN 
IIQPVKEKLK KDFSKFIFGE NDDTLPSVLI RELTERNQTI VFAESCTGGL LSSSLTSISG 
SSKVFKGSVV SYSNELKNSL LNISEEKLTK YGAVSEEVCE SMAINAKEKL GADWAIAISG 
IAGPKGGSQD KPVGLVYISI SGPNNHITNI KKLFNSTRNR VEIQTLSVNV CLNSLRLILL 
SNSK