Gene NATL1_05251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_05251
Symbol	qri7
ID	4780725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	476784
End bp	477854
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	36%
IMG OID	640083800
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_001014352
Protein GI	124025236
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.110591
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAATAA TTTTATCCCT CGAAACAAGT TGTGACGAGT CTGCAGCGGC TTTGGTTTCT 
AATGAAAAAG GAAAAATTGA TTTGTTAGCT AATGAAATAG CTTCACAAAT TGATGAACAT 
GCTAATTGGG GTGGTGTTGT TCCAGAAATC GCTTCAAGAA GACATTTAGA AAACCTTCCA 
TTTTTGATTG AAGAGGTTTT TGCAAAATCA ACATTACAGA TAAAAGATAT AGATGCAGTA 
GCCGCAACTG TTACTCCAGG ATTAGCAGGA TCACTGTTGG TCGGATCAAT TACGGCAAGA 
ACTTTAGCTA ATTTACATCA AATACCATTC TTAGGTATCC ATCACTTGGA GGGACATCTT 
TCCTCAATAT ATTTGTCAGA AAACCATCCC AAACCCCCTT TTTTAGTCTT ATTGGTTAGT 
GGAGGACACA CTGAATTGAT AAAAGTAGAT GTTAAACATA AGTATCAACG TCTTGGTAGA 
AGTCATGATG ATGCAGCTGG AGAAGCTTTT GATAAGGTTG CAAGACTTTT GGGACTTTCA 
TATCCAGGGG GCCCTGCAAT TCAAAAAATA GCTAAATCGG GAGACCCAAA AAAATTTTTA 
TTTCCAAAAG GAAGAGTCTC TAAACCTGAA GGTGGTTTTT ATCCATATGA CTTTTCTTTT 
AGTGGTTTAA AAACGGCTGT ATTTCGCCAG ATAGAAAAAA TTAGATCAGA AAATAAAAAA 
TTACCAATAG AAGATATTGC TGCAAGTTTT GAATACATAG TGGCTGAAGT CTTAGTAGAG 
AGGAGCTTTA AATGTGCCCT TGACCAAGGT TTAAATTCTC TTGTTTTAGT TGGAGGAGTT 
GCTGCAAATG TGAGATTAAG GGAAATGATG CTTGCAAAAG CATCTAAAAA TTCAATTGAT 
ATTACTCTTG CACCAATGGA ATTTTGTACT GATAATGCGG CAATGATTGG GGCGGCAGCT 
TTGTTAAGAT TATCGTCTGA AGGCTTTAAA AGTTCAATGG AATTAGGTGT ATCTGCTCGT 
TGGCCACTAG AAAAATCTGA TTCACTTTAT GATCCGATTC CTCCTTTTTA A

Protein sequence

MSIILSLETS CDESAAALVS NEKGKIDLLA NEIASQIDEH ANWGGVVPEI ASRRHLENLP 
FLIEEVFAKS TLQIKDIDAV AATVTPGLAG SLLVGSITAR TLANLHQIPF LGIHHLEGHL 
SSIYLSENHP KPPFLVLLVS GGHTELIKVD VKHKYQRLGR SHDDAAGEAF DKVARLLGLS 
YPGGPAIQKI AKSGDPKKFL FPKGRVSKPE GGFYPYDFSF SGLKTAVFRQ IEKIRSENKK 
LPIEDIAASF EYIVAEVLVE RSFKCALDQG LNSLVLVGGV AANVRLREMM LAKASKNSID 
ITLAPMEFCT DNAAMIGAAA LLRLSSEGFK SSMELGVSAR WPLEKSDSLY DPIPPF