Gene Tery_4232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_4232
Symbol
ID	4245884
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	6533207
End bp	6535552
Gene Length	2346 bp
Protein Length	781 aa
Translation table	11
GC content	35%
IMG OID	638109128
Product	ATP-dependent DNA helicase Rep
Protein accession	YP_723706
Protein GI	113477645
COG category	[L] Replication, recombination and repair
COG ID	[COG0210] Superfamily I DNA and RNA helicases
TIGRFAM ID	[TIGR01073] ATP-dependent DNA helicase PcrA

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.491131
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.505763
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAAGCA CTGACTTTCT GACTCAGCTA AATTTATCCC AACGCCAAGC AGTAGAACAT 
TTCTGCGGAC CTATGTTGGT CGTGGCGGGT GCTGGGTCTG GCAAAACTAG GGCGTTGACT 
TATCGTGTAG TCCATCTAAT ACGTCATCAT CGGGTACATC CAGAAAATAT TCTGGCGGTT 
ACCTTTACAA ATAAAGCTGC ACAGGAAATG AAGGACCGCA TTGAAAAAGT ATTTGCTCAA 
GAACAAGCGG AAGCTAAATA TAACAAACCA TTTTCAGCAT TGACATCAGA AGAACAAATC 
AGGTTGCGAT CGCAAGTCTA CAAAAATATC ACTAAACATT TATGGGTGGG AACTTTTCAT 
AATCTTTGCG CTCGTATTCT GAGGTTTGAT ATTAACAAAT ATCAGGATGA AAAAAAACGT 
CATTGGGATA AAAATTTTTC TATATTTGAT GAAAGTGATG CTCAAAGTTT AATTAAGCAA 
ATTGTCACTA AACAGCTAAA TTTGGATGAT AAAAAATTTG AACCACGTTC TGTGAGATAT 
GCCATTAGTA ATGCTAAAAA CCAAGGAATG TCACCTCTAG AATATCAAAG AGCCGAGCCA 
GATTATCGGG GACGGGTAAT TGCTGAAGTT TATGGAATTT ATCAAGATAA TTTAGCTGCG 
AACAATGCTC TTGATTTTGA CGACCTAATC AGAATACCAG TAGAATTATT TCGGCAAAAT 
GAGCAAATAT TAGCTTATTG GTATCAACGT TTTAATCATA TTTTAGTAGA TGAATATCAA 
GATACTAATC GGACTCAATA TAATTTTATT AGATTTTTAG CTACTAATGG TGAAGACCCT 
AAATATATTA AAAACTGGGA AAATCGTTCT ATTTTTGTGG TAGGAGATGT AGACCAATCT 
ATTTATTCTT TCCGCATGGC AGATTATACA ATTTTGCTTG ATTTTCAGAA TGATTTTGGC 
GATGGTTTAG CTGATGAATA TACTCAGACA ATGATTAAGT TGGAGGAAAA TTATCGCTCA 
CGGGAAAATA TTTTGGCAGT GGCAAATAAG TTGATTGAAA ATAATACTCA ACGTATTGAC 
AAAACTCTCA AACCAACCAG GGGCATAGGG GAAGAAATTT ATTGTTATGA GGCAGAAAAT 
GAGTTAGAAG AAGCAGAATT TATTTGTAGT AAAATTGCAG AAATTACAGA CCAATATCCA 
GACTTAGATT TAGGAAGCTT CGCTGTACTT TATCGAACAA ACTCTCAGTC ACGCTCCCTC 
GAAGAAAAGT TGATTCATTA TGATATTAAA TATGTCATAA TTGGGGGATT GAGATTTTAT 
GATCGGAAAG AAATTAAGGA TGCTTTAGCT TATTTACGAG TCATTGCAAA TCCTGCTGAT 
ACTGTTAGTT TACTCAGAAT TATTAACACT CCGAGAAGGG GTATTGGCAA GGCAACTATT 
GATAGTTTAT TAAATGCTAG TTCCCAGATG GGAATACCTT TGTGGGAAAT TATTAATGAT 
CAAGCTTCAG TAAATGCTTT GGCAGGTCGT TCATCAAAAG CTGTAAATAA GTTTGCCGAA 
GTAATTCAAC ATTTGCAAGA TGAGTTAGAA AATTTGACTG CTCTGGAAAT TGTTGAGAGA 
ATTTTAGAAA ATTCTGGTTA TATTGAAAAC TTGAAAAAAC AGGATACGGA AGATGCAGAT 
AATCGACTGG CAAATTTAGG AGAATTATGT AGTGCTGTAG CTCAGTTTCA AGAAGATAAT 
GAAGATACAA CTTTAGGAAG TTTTTTAGCA AATGCTTCTT TAGCTTCTAA TTTAGATAAC 
CTTCAAGATG GGCAGGAAGC TGTGTCTTTA ATGACTTTAC ATTCTGCTAA AGGTTTAGAA 
TTTCCCGTAG TATTTATAGT GGGTTTGGAG CAAGGTTTAT TACCTCATTT TCGGAGCATA 
AATGACCCTT TATCTTTAGA AGAAGAAAGG CGACTTTGTT ATGTAGGTAT TACTAGAGCC 
GAAGAACAAT TATTTTTTTC TTATGCAACT GAAAGACGAC AGCTTTGGGG AGCAAGAGAT 
GCCACAGTTC CATCTCAATT TTTGGGAGAA TTACCAAGAG ATTTGATTAA TACTAATGGG 
ATGAAAAAAG TAATTTATCC GTCAAAGCAT CAAAGGAAAA ACACAAAAAA TACTGTTGGA 
AAAAAATCGG TAAGTAATCA AATAAAAAGT TGGCAAGTCG GGGATAAAGT GATGCATGAA 
AGTTTTGGTG TGGGGTTAGT AACAAACATT CTGGGTGAAG GACATAAGAT GAGTTTAGGT 
ATCAAATTTG GTAAGAGTAA AAAAATTATT GATCCCAAAA CGCCATCAAT AGAAAAGTTG 
AATTAA

Protein sequence

MPSTDFLTQL NLSQRQAVEH FCGPMLVVAG AGSGKTRALT YRVVHLIRHH RVHPENILAV 
TFTNKAAQEM KDRIEKVFAQ EQAEAKYNKP FSALTSEEQI RLRSQVYKNI TKHLWVGTFH 
NLCARILRFD INKYQDEKKR HWDKNFSIFD ESDAQSLIKQ IVTKQLNLDD KKFEPRSVRY 
AISNAKNQGM SPLEYQRAEP DYRGRVIAEV YGIYQDNLAA NNALDFDDLI RIPVELFRQN 
EQILAYWYQR FNHILVDEYQ DTNRTQYNFI RFLATNGEDP KYIKNWENRS IFVVGDVDQS 
IYSFRMADYT ILLDFQNDFG DGLADEYTQT MIKLEENYRS RENILAVANK LIENNTQRID 
KTLKPTRGIG EEIYCYEAEN ELEEAEFICS KIAEITDQYP DLDLGSFAVL YRTNSQSRSL 
EEKLIHYDIK YVIIGGLRFY DRKEIKDALA YLRVIANPAD TVSLLRIINT PRRGIGKATI 
DSLLNASSQM GIPLWEIIND QASVNALAGR SSKAVNKFAE VIQHLQDELE NLTALEIVER 
ILENSGYIEN LKKQDTEDAD NRLANLGELC SAVAQFQEDN EDTTLGSFLA NASLASNLDN 
LQDGQEAVSL MTLHSAKGLE FPVVFIVGLE QGLLPHFRSI NDPLSLEEER RLCYVGITRA 
EEQLFFSYAT ERRQLWGARD ATVPSQFLGE LPRDLINTNG MKKVIYPSKH QRKNTKNTVG 
KKSVSNQIKS WQVGDKVMHE SFGVGLVTNI LGEGHKMSLG IKFGKSKKII DPKTPSIEKL 
N