Gene Tery_1027 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_1027
Symbol
ID	4243106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	1602686
End bp	1603732
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	35%
IMG OID	638106263
Product	cobalamin biosynthesis protein CobW
Protein accession	YP_720875
Protein GI	113474814
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID	[TIGR02475] cobalamin biosynthesis protein CobW

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.959481
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGCTA AAATTCCAGT TACTGTAATT ACGGGTTTTC TCGGTAGTGG TAAAACTACG 
ACAATTCGCC ATTTATTAAA AAATAATAAA GGTCGTCGCA TTGCTGTTTT AGTGAATGAA 
TTTGGTGAAG TTGGTATAGA TGGAGATTTA TTACGTTCTT GTCAAGTTTA TGATGAGGAA 
GGTATTATTA ATAATATTGT TGAACTAAAT AATGGTTGTC TTTGCTGTAC TGTGCAAGAG 
GAATTTTTTC CGACTATGCA AGAACTATTA AAACGTCGAG AAAAAATTGA TTCTATTTTA 
ATTGAAACTT CTGGGTTAGC TTTACCAAAA CCTTTGGTAC AAGCATTTCG TTGGCCTCAA 
ATTAAGACTT CTGCTACGGT GGATGGAGTT GTTACTGTTG TTGATTGTGA AGCTGTGGCA 
AATGGTAGTT TGGTTGGAGA TATTGATGCT TTGAAAGCTC AACGTCAAGC TGACCCAAAT 
TTGGATCATG AAACCCCTAT TGAGGAATTA TTTGAAGATC AGTTAGCTTG TGCTGATCTG 
GTTTTATTAA CTAAGGTTGA TATGGTGGAT GAAGCTACTT CTGATAAAGT ACAAAATTGG 
TTGAGGGAGC ATTTGCCTAA AACTGTGAAA ATAGTTCCTT GTATTGGAGG TGAAATTAAT 
CCAGATTTAT TGTTGGGTTT TAATGCTGTA GTTGAAGATA ATTTAGATTC TCGTCCTAGT 
CACCATGATA CTCAAGAAGA ACATGAACAT GATGATGAAA TTAATTCTGT ACATTTAATT 
TTGGATGAAG AGTTTGAACC CCAAGGGTTA GTTGAAAAGT TGAACGGTTT AGTGACAAAT 
TCTGAAATAT ATCGGATTAA AGGTTTTGTG GCAGTGCCAA ATAAGTCTAT GCGTCTGGTT 
TTGCAGGGGG TGGGTTCACG CTTTGATTTT TTCTATGACC GTCTCTGGCA AAAACAGGAG 
ACTAGGCAAA CTAAGTTAGT TTTAATTGGT CGTTCTCTAC AAAGAGAAAA AATTTACTCC 
GAGCTGGTTT CTAATTTCTC TAATTAA

Protein sequence

MSAKIPVTVI TGFLGSGKTT TIRHLLKNNK GRRIAVLVNE FGEVGIDGDL LRSCQVYDEE 
GIINNIVELN NGCLCCTVQE EFFPTMQELL KRREKIDSIL IETSGLALPK PLVQAFRWPQ 
IKTSATVDGV VTVVDCEAVA NGSLVGDIDA LKAQRQADPN LDHETPIEEL FEDQLACADL 
VLLTKVDMVD EATSDKVQNW LREHLPKTVK IVPCIGGEIN PDLLLGFNAV VEDNLDSRPS 
HHDTQEEHEH DDEINSVHLI LDEEFEPQGL VEKLNGLVTN SEIYRIKGFV AVPNKSMRLV 
LQGVGSRFDF FYDRLWQKQE TRQTKLVLIG RSLQREKIYS ELVSNFSN