Gene Tery_0441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_0441
Symbol
ID	4242219
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	694774
End bp	695922
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	34%
IMG OID	638105759
Product	cobalamin synthesis protein, P47K
Protein accession	YP_720373
Protein GI	113474312
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.319844
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.988623
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATTAA CAACTACTCA GTTAGATAAC TCAAATATAG ACACCCCAAA ACATGGTTTA 
CCAGTGACAA TAATTACAGG TTTTCTGGGG AGTGGGAAGA CTACTTTACT TAACCATATA 
TTGCAAAACC AAGAGGGTGT TAAAACTGCT GTTTTGGTAA ATGAATTTGG AGAAATTGGG 
ATTGATAATG AGTTAATTGT TTCTACCAAT GCAGATGACA CAATGGTAGA ACTTAGTAAT 
GGTTGTGTTT GTTGCACTAT TAATGAGGAC TTGGTTAATG CAGTTTATAA GATTTTAGGA 
AAATCAGAAA AATTTGATTA TATGGTAGTA GAAACTACTG GTTTAGCTGA CCCATTGCCA 
GTAGCTTTAA CCTTTTTAGG CACTGAGTTA AGAGATATGA CTCGCTTAGA TTCAATTATT 
ACTTTGGTAG ATGCTGCTAA CTATAGTGTT GATTTGTTTA AGAGTCAAGC AGCACATAGT 
CAAATTGTCT ATAGTGATAT TATTTTGTTG AATAAAACTG ACTTGGCAGA TGAAGCATAT 
TTAGATTTAT TGGAAGTGAA AATTAGAAAT CTTAAAAAAG ATGCTAGAAT TATTAGAACT 
AAGAAATCAC AAGTAGCTTT ACCATTAGTT CTGAGTGTTG GTCTATTCGA GTCAGATAAG 
TATTTTGAGT TGGCAGAAGT TGATCAGCAC CATAATCATG GCCATGACCA TCATGATCAT 
GATCATGAAC ACGAACATCA TCACCATGAC CATGAACACG AACATCATCA CCATGACCAT 
GGACATGAAC ATCATCACCA TGACCATGGA CATGAGCATC ATCACCATGA ACACGATCAC 
TATCATTCTA ACCATTTAGA AAATGATGGA TTTACTTCTA TTTCTTTTCA AAGTGATAAA 
CCTCTTTCAA TGAAGAAATT TCAACATTTT TTAGATAATA AATTACCAGC AAATGTTTTC 
CGAGCTAAGG GTATTTTATG GTTTCAAGAA AGCTCTTTAC GACACATATT TCACTTAAGT 
GGTAAGCGGT TTAGTATTGA AGATGATCAG TGGAATGGTA ATAATCATAA AAATCAGTTA 
GTTTTCATTG GTCAGAACTT AGACCATGAG AAGTTGCGAT CGCAATTAAA AGATTGTGTT 
ATCTCCTAA

Protein sequence

MQLTTTQLDN SNIDTPKHGL PVTIITGFLG SGKTTLLNHI LQNQEGVKTA VLVNEFGEIG 
IDNELIVSTN ADDTMVELSN GCVCCTINED LVNAVYKILG KSEKFDYMVV ETTGLADPLP 
VALTFLGTEL RDMTRLDSII TLVDAANYSV DLFKSQAAHS QIVYSDIILL NKTDLADEAY 
LDLLEVKIRN LKKDARIIRT KKSQVALPLV LSVGLFESDK YFELAEVDQH HNHGHDHHDH 
DHEHEHHHHD HEHEHHHHDH GHEHHHHDHG HEHHHHEHDH YHSNHLENDG FTSISFQSDK 
PLSMKKFQHF LDNKLPANVF RAKGILWFQE SSLRHIFHLS GKRFSIEDDQ WNGNNHKNQL 
VFIGQNLDHE KLRSQLKDCV IS