Gene Tery_1047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_1047
Symbol
ID	4242010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	1636808
End bp	1638328
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	40%
IMG OID	638106280
Product	AAA ATPase, central region
Protein accession	YP_720892
Protein GI	113474831
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0464] ATPases of the AAA+ class
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.696597
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0936811
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGAAG AACTCAATAT TCTAATCGAA GCTCAATATC CTTTGATCTA CCTCGTAACC 
TCCGAGGAAG AGCGGTCAGA GCAGGCAATT TTAGCATTAG CTCAGAGAAA ACTACAGCGC 
AAAGTATTTG TTTGGACAGT GACTCACGGT ATTACAGACT ATGATCAGAG CAAAAATACG 
ACTCAGCACA ATACAGTCTC GCCCGAGTCA GCTATAGAGT GGGTAATTAG GCAGCGAGAT 
CCTAACACTG GCGCTGGAAT ATATGTATTC AAGGATTTAC ATCCTTTTAT CGATTCACCA 
CCAGTTACTA GGTGGTTAAG AGATGCGATA GCTAGTTTTA AAGGTACAAA AAAGACAATT 
ATATTAATGT CTCCTGTGCA AAATGTACCC ATAGAATTAG AAAAGGAAGT AGTTGTCCTT 
GACTTTCCAT TGCCAGATAT GAAAGAATTA AATCAAGTTC TCTCAGGACA ATTAGATTCT 
GCTAAAAACC GACGTATTTC TACAGAAACA AGAGAAAAAC TACTAAAAGC AGCTCTGGGT 
TTGACAAAAG ATGAAGCCGA AAAAGTATAT CGTAAAGCTC AAGTAACAGC AGGACGCCTA 
ACTGAAAAGG AAGTTGACAT TGTACTTTCT GAGAAAAAAC AGCTCATCAG GCGCAACGGT 
ATACTAGAAT ACATCGAAAA GGACGAAACT ATAAATGCTG TAGGTGGTCT AGAGGAGTTG 
AAACATTGGT TAAGGCAACG TTCTGATGCC TTTACAGAGC GTGCCCGAGA ATATGGACTA 
CCTCAACCAA AGGGAATGTT GATTCTAGGA ATACCTGGAT GTGGCAAGTC TCTGATAGCA 
AAAACTACAT CTGGTCTATG GGGTCTACCT TTATTGCGAT TAGATATGGG ACGTGTATAC 
GATGGTTCAA TGGTAGGACG CTCAGAGGCT AACTTGCGAA ATGCTCTCAG AACAGCTGAA 
TCAATTTCAC CTGCTATTTT ATTTATAGAT GAGTTAGATA AAGCCTTTGC AGGTAGTACA 
GGTTCAGCTG ATTCTGATGG AGGTACTTCT AGTCGGATAT TTGGCTCATT CCTAACTTGG 
ATGCAGGAAA AAACTTCTCC AGTGTTTGTT ATGGCAACTG CCAACCGGGT AGAACGTCTA 
CCAGGAGAGT TTTTGAGAAA AGGTAGGTTT GATGAAATTT TCTTTGTAGA CTTACCAAAC 
AAAGAAGAAC GCCAAGATAT TTTCCAAATT CACCTAATAA AAAGACGTCG AGATATTGAA 
CGCTTCGATC TGGATCAACT ATCTAATGTA TCCGATGGCT TTTCAGGTGC AGAAATAGAG 
CAAGCCATAA TTGCTGCTAT GTATGAAGCA TTTGCTCAAG ATAGAGAATT TACACAGCTA 
GATATTATTG CCGCAATTAA ATCTACACTA CCGTTATCGA AGACCATGAC AGAGCAAGTT 
ACTGCTCTAA GAGATTGGGC TAGACAACGT GCGCGGCCTG CTGCATCTTC AGTTGCCGAG 
TATCAAAGAC TGGAGTTCTA A

Protein sequence

MKEELNILIE AQYPLIYLVT SEEERSEQAI LALAQRKLQR KVFVWTVTHG ITDYDQSKNT 
TQHNTVSPES AIEWVIRQRD PNTGAGIYVF KDLHPFIDSP PVTRWLRDAI ASFKGTKKTI 
ILMSPVQNVP IELEKEVVVL DFPLPDMKEL NQVLSGQLDS AKNRRISTET REKLLKAALG 
LTKDEAEKVY RKAQVTAGRL TEKEVDIVLS EKKQLIRRNG ILEYIEKDET INAVGGLEEL 
KHWLRQRSDA FTERAREYGL PQPKGMLILG IPGCGKSLIA KTTSGLWGLP LLRLDMGRVY 
DGSMVGRSEA NLRNALRTAE SISPAILFID ELDKAFAGST GSADSDGGTS SRIFGSFLTW 
MQEKTSPVFV MATANRVERL PGEFLRKGRF DEIFFVDLPN KEERQDIFQI HLIKRRRDIE 
RFDLDQLSNV SDGFSGAEIE QAIIAAMYEA FAQDREFTQL DIIAAIKSTL PLSKTMTEQV 
TALRDWARQR ARPAASSVAE YQRLEF