Gene A9601_00871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_00871
Symbol
ID	4716770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	91049
End bp	92149
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	35%
IMG OID	640077785
Product	hypothetical protein
Protein accession	YP_001008482
Protein GI	123967624
COG category	[S] Function unknown
COG ID	[COG3330] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCTGATG GGATCATGAA TAAAGATCAA TTACTCTCAC TAACCCTCAG ACAATTACGT 
CAAGAAGCAA GTAAATTATC GGTTCCGCTG TATAGTCGCA AAACAAAAGC TGTTTTAGTC 
GATTTAATAC TTAAATATCA AGAAAAATCT ACAAAAAAAA CCTACATTGT AGCTTCTCAG 
TCAAAACCTG AAGAAACTGC TGAGTCCAAT TCTTTCAACA GTAGTGAAGA AGTTAAAACA 
AATGTAGTTT TCCTACCGCG AGATCCAGAT TGGGCTTATG TTTTCTGGCA AATTTCTGAT 
GCAGATAGAG AAAAAGCACA ATCTTTAGGA GCCAATAAAT TATGTTTACG ATTATTTGAT 
GCATCTGGTT CTGAAGGAAG CAACTTGAAT CAAGGAACAC TTAGGGAGAT AGCAGTTGAT 
AGTTACAGTA CTGAGTGGTA CTTGCCGATC CCACTTGCAG ATAGAGATTA TAAAGTTGAA 
TTAGGTTACA AATATGGTTT TAACTGGATG TCATTGGCAT TTTCTTCAAT AAGCCATGTT 
CCTGGGTCTC ATCCCTCTGA GCAAATTCTT GATAAATTTG TGCCTTTTAA TTTAGATTCT 
ACTTCTGAGT CAATACCAGA TATTTCTAAT TCTGTTGTTT CAGAACAAAA TGGTATGCAT 
GAAAGGTTAT ACCAAGCAGC AACTAATATT CCTCTCAGAA GAAAAGTTGG TTCTGAAGAA 
TTTATGGAAA ACTTAAATTC AACAAACCTT AACGATAATC TTACAGACTC AGGTGCTGGT 
AAATGGTCAT CAGGTTTAAA TGATTCTGGA AGCGGAATTG TTAAAAATAG ATCTTTTTGG 
CTCGTTGCTG ATGCTGAATT AATTGTTTAT GGAGCTACAG AGCCTTCTGC AAAACTAACA 
ATAGGTGGAG AAGATGTACC TCTTGCTGCA GATGGTACTT TTAGAATTCA AGTTCCATTT 
AGAGACGGGA CTCAAAAATA TGATATTAAA GCTGTTGATG TGTCTGGTGA GCAAGAAAAA 
AGTATATCAA TGAAATTTGA TAGATCTACT CCACTTGACG ATACTAATGA AAAAGATAAT 
GCTGAGACTG AATGGTTTTG A

Protein sequence

MADGIMNKDQ LLSLTLRQLR QEASKLSVPL YSRKTKAVLV DLILKYQEKS TKKTYIVASQ 
SKPEETAESN SFNSSEEVKT NVVFLPRDPD WAYVFWQISD ADREKAQSLG ANKLCLRLFD 
ASGSEGSNLN QGTLREIAVD SYSTEWYLPI PLADRDYKVE LGYKYGFNWM SLAFSSISHV 
PGSHPSEQIL DKFVPFNLDS TSESIPDISN SVVSEQNGMH ERLYQAATNI PLRRKVGSEE 
FMENLNSTNL NDNLTDSGAG KWSSGLNDSG SGIVKNRSFW LVADAELIVY GATEPSAKLT 
IGGEDVPLAA DGTFRIQVPF RDGTQKYDIK AVDVSGEQEK SISMKFDRST PLDDTNEKDN 
AETEWF